更新时间:2025-09-08 GMT+08:00
分享

告警策略

仅Skywalking接入类型的应用支持为单个组件创建自定义链路追踪的告警策略。

创建APM告警策略

  1. 登录APM控制台
  2. 单击左侧,选择“管理与监管 > 应用性能管理 APM”,进入APM服务页面。
  3. 在左侧导航栏选择“链路追踪 > 指标”。
  4. 在界面左侧树单击对应环境后的,默认进入“组件设置”页面。单击“告警策略”,进入告警策略页面。

    图1 告警策略页面

  5. 单击“新建告警策略”,切换至告警策略页签。

    1. 基础信息
      图2 基础信息
      表1 告警策略基础信息参数列表

      选项

      含义

      策略名称

      自定义的名称,不能为空。

      只能输入字母,数字,下划线,短横线,汉字。输入长度不能超过512个字符。

      告警等级

      定义告警等级,分为“轻微”、“严重”。

      监控对象

      需要监控的对象名称。默认为当前环境的名称,且不支持修改。

      告警策略类型

      分“单机”、“聚合”。单机指单实例指标告警;聚合指组件下所有实例聚合指标告警。

      监控类型

      选择需要监控的“监控类型”。被选中监控类型的信息,会显示在右侧。

      指标集

      选择需要监控的“指标集”。被选中指标集的信息,会显示在右侧。

    2. 告警规则
      图3 告警规则
      表2 告警策略告警规则参数列表

      选项

      含义

      维度

      可选。对于不同指标集细粒度的定义。

      指标

      对于指标集中某一个指标定义一个或多个告警规则。

      指标:指标集中的某一个指标。例如:监控项:URL 监控;指标集:汇总。则告警规则的指标可选为“错误次数”。

      操作符:表示指令应进行什么性质的操作。

      阈值:指标集中的某一个指标的阈值。

      告警条件

      定义告警的触发条件。

      A :表示A次采集周期,A的取值范围为数字1-10(次)。

      B :满足B次触发告警,B的取值范围为数字1-10(次),且不能大于A。

      C :相同告警,在C分钟内,不再发送。C不能小于数字10分钟。

      恢复策略

      定义告警的恢复条件。

      恢复时通知

      告警恢复时是否触发额外的通知。

      严格模式

      当指标有多个对象返回值时,通过此选项可对返回的所有指标做告警表达式异常检测。

      例如:一台主机有多核CPU时,CPU单核使用率有多个值cpu_no=0,usage=98;cpu_no=1,usage=99。

    3. 告警通知
    图4 告警通知
    表3 告警策略告警通知参数列表

    选项

    含义

    告警通知内容

    用户收到的告警详细内容,输入长度不能超过500个字符。

    • 当告警规则中的“严格模式”开关打开时,告警通知内容包括“变量”和“循环”两种格式。“严格模式”开关关闭时,仅可以选择“变量”一种格式。
    • 告警通知内容,可以自定义或选采集的指标内容。
    • 选择采集的指标内容:“基础信息”右侧,单击指标名称前,将指标内容引用到告警通知内容框。

    选择通知对象

    • 在下拉列表中,选择通知对象。
    • 告警会发送告警通知,给被选的通知对象。未被选的通知对象,不会发送告警通知。
    • 单击,获取最新的通知对象。

  6. 信息填写完整后,单击“确定”完成告警策略配置。

更多操作

告警模板创建完成后,您还可以执行表4中的操作。
表4 相关操作

操作

说明

编辑告警策略

在“操作”列选择,可对告警策略重新编辑。

删除告警策略

在“操作”列选择,可删除所选告警策略。

启、停告警策略

在“操作”列选择停用告警策略,选择启动告警策略。

相关文档