search
异常检测 检测规则 阈值检测

阈值检测

概述

阈值检测用于监控指标数据异常,用户可设置阈值范围,当指标到达阈值后触发告警并通知用户。支持同时检测多个指标数据并设定告警级别。

规则说明

在检测规则配置页面,你需要填写以下信息:

检测指标

1)规则名称:检测规则的名称。

2)检测指标:设置监控的指标数据,支持同时检测多个指标并添加标签过滤及计算表达式。(例如:统计 CPU 占用率,取 1 h 内数据的平均值作为结果展示)

检测指标

字段 说明
指标别名 当前检测指标的别名,默认按指标的添加顺序加上 M 前缀后自动递增,例:M1 M2 M3 ... ,支持用户自定义进行修改
指标集 当前检测指标所在的指标集
指标 当前检测所针对的指标
聚合周期 当前检测指标的数据聚合周期,默认为 1 分钟
聚合算法 包含Mean(取平均值)、Count(取数据点数)、Median(取中位值)、Mode(取出现频率最高的值)、Sum(求和)、Stddev(取标准差)、Spread(取最大值和最小值的差值)、First(取第一个值)、Last(取最后一个值)、Min(取最小值)、Max(取最大值)
标签筛选 基于指标的标签对检测指标的数据进行筛选,限定检测的数据范围,支持添加一个或多个标签筛选
表达式 针对当前检测指标进行简单的加减乘除计算,可以点击「fx」添加计算表达式,其中 $$value 表示当前选择的指标值(例如:你可以输入表示 100 - $$value,表示检测值是100减去当前值)

3)触发维度:分组决定着检测规则基于哪个维度触发,即触发对象。支持添加多个分组字段,任意一个分组数据的指标满足告警条件则触发告警。

4)触发条件:设置触发告警的条件和告警级别。

  • 告警级别:包含严重、警告、提示三个等级,每个等级只能设置一个触发条件,最多设置三个;

  • 告警条件:基于选择的指标设置逻辑判断,支持比较操作符(=、>、< 等)。当添加了多个指标时,支持“并且” 和 “或者”两种取值方式。

5)无数据告警:设置在多久时间内没有数据后触发告警。检测的指标中有一个满足该条件,则触发该告警。支持用户设置无数据告警的等级和触发动作。

6)触发动作:可设置不同的触发动作通知用户,目前支持发送邮件、发送钉钉消息、产生王教授情报、webhook回调和自定义触发动作 5 种类型的触发动作。在编辑告警消息时可以使用预置的模板变量。 如何使用模板变量?

7)告警沉默:设置在一定时间范围内,相同的告警不再进行通知提示。

8)检测频率:当前检测规则的执行频率,默认 1 分钟检测一次,最大可设置为每 30 天检测 1 次。

9)有效期:超出有效期检测规则自动禁用,默认为 1 周。

10)标签:自定义检测规则的标签,方便对检测规则和产生的告警事件进行管理。