包含"prometheus"标签的文章
-
如何使用Prometheus监控MongoDB集群
在实际企业环境中,MongoDB需要多节点部署组成一个集群,可用于确保高可用性、容量扩展、负载均衡和数据备份,此时需要对整个MongoDB集群进行监控,持续关注集群的健康状况,因此我们使用MongoDBExporter将指标转换为Prometheus的数据类型,最后通过Prometheus进行收集M...
-
代替 采集监控指标 使用 Prometheus Vmagent
单个vmagent实例可以抓取数万个抓取目标,但是有时由于CPU、网络、内存等方面的限制,这还不够,在这种情况下,抓取目标可以在多个vmagent实例之间进行拆分,集群中的每个vmagent实例必须使用具有不同,promscrape.cluster.memberNum值的相同,promscrape....
-
Prometheus完胜Zabbix 监控大规模Hadoop集群
作者介绍洪迪,联通大数据高级运维开发工程师,主要负责大数据平台运维管理及核心监控平台开发工作,具有多年大数据集群规划建设、性能调优及监控体系建设经验,对Prometheus架构设计、运维开发等方面有深入理解和实践,背景随着公司业务发展,大数据集群规模正在不断扩大,一些大型集群物理机节点甚至已近上千,...
-
深入理解Alertmanager 源码解读如何自定义Alert的恢复时间
默认的5分钟对于prometheusmetric告警是足够的,但如果想使用基于loki的日志告警,通常为了控制资源消耗,不会设置很大的评估范围,,有时候偶发一个告警,然后很快就恢复了;或者想基于Event类型的事件告警,因为触发频率低,且不会持续发送,5分钟就比较容易误解,...。...
共1页 4条