手机版 欢迎访问it开发者社区(www.mfbz.cn)网站

当前位置: > 开发

Prometheus + Grafana (二)实现自动告警

时间:2021/4/20 13:33:21|来源:|点击: 次

服务器的监控与告警


参考:https://mp.weixin.qq.com/s/DILXvkvpS25VJbb3FalBqQ

CPU
内存
磁盘
可用性
服务状态
网络

CPU

100-(avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance)* 100) > 60

node_load5 > on (instance) 2 * count by(instance)(node_cpu_seconds_total{mode="idle"})

内存

node_memory_MemTotal_bytes:主机上的总内存
node_memory_MemFree_bytes:主机上的可用内存
node_memory_Buffers_bytes:缓冲缓存中的内存
node_memory_Cached_bytes:页面缓存中的内存

100 - sum(node_memory_MemFree_bytes{job="node-exporter"} + node_memory_Buffers_bytes{job="node-exporter"} + node_memory_Cached_bytes{job="node-exporter"})by (instance) / sum(node_memory_MemTotal_bytes{job="node-exporter"})by(instance)*100 > 80

磁盘

predict_linear(node_filesystem_free_bytes{job="node-exporter",mountpoint!=""}[1h], 4*3600) 

(100 - (node_filesystem_avail_bytes{fstype!="",job="node-exporter"} / node_filesystem_size_bytes{fstype!="",job="node-exporter"} * 100)>80) and (predict_linear(node_filesystem_free_bytes{job="node-exporter",mountpoint!="",device!="rootfs"}[1h],4 * 3600) < 0)

100-(avg(irate(node_disk_io_time_seconds_total[1m])) by(instance)* 100)

可用性

up{job="node-exporter"}==0

服务状态

1、docker

node_systemd_unit_state{name="docker.service",state="active"} == 1

Copyright © 2002-2019 某某自媒体运营 版权所有