异常检测库 内置检测库
内置检测库
概述
DataFlux 内置多种检测库,开箱即用。支持主机CPU、内存、磁盘、端口等多种内置检测项,开启后,即可接收到异常事件告警。
进入「异常检测库」页面,可选择开启内置检测库。
内置检测库
内置检测项 | 报警级别 | 规则说明 |
---|---|---|
主机Datakit状态检测 | Critical | state值为offline |
Linux 主机 Datakit 没有正常运行 | Critical | 按 host 分组10分钟数据点,判断后5分钟数据缺失的 host |
Linux 主机刚刚被重启 | Critical | 15分钟内数据点 uptime 存在差值 < 0的 |
Linux 主机存在僵尸进程 | Warning | zombies 最小值 >= 1 |
Linux 主机 Swap 使用率大于 50% | Warning | 80 > used_percent >= 50 |
Linux 主机 Swap 使用率大于 80% | Critical | used_percent >= 80 |
Linux 主机 CPU 使用率大于 80% | Warning | 90 > (100 - usage_idle) >= 80 |
Linux 主机 CPU 使用率大于 90% | Critical | (100 - usage_idle) >= 90 |
(虚拟机)Linux 主机平均每核 CPU 负载大于 5 | Warning | 10 > avg(load_5) / avg(n_cpus) >= 5 |
(虚拟机)Linux 主机平均每核 CPU 负载大于 10 | Critical | avg(load_5) / avg(n_cpus) >= 10 |
Linux 主机 CPU IOWAIT 大于 60% | Critical | usage_iowait |
Linux 主机磁盘剩余空间小于 5% 并且小于 5G | Critical | sum(free)/sum(total) *100 < 5 && free < 5G |
Linux 主机磁盘剩余空间小于 10% 并且小于 10G | Warning | sum(free)/sum(total) *100 < 10 && free < 10G |
Linux 主机可用内存小于 100M | Critical | available < 100M |
Linux 主机内存使用率大于 80% | Warning | 90 > 100 - avg(available_percent)>= 80 |
Linux 主机内存使用率大于 90% | Critical | 100 - avg(available_percent)>= 90 |
Linux 主机端口运行状态异常 | Critical | 5分钟 resultCode 最小值 > 0 为异常 |