更新时间:2024-10-08 GMT+08:00

告警规则

概述

  • 阈值告警相关概念:
    • 告警规则:告警规则由告警规则名称,告警规则描述,规则绑定集群列表,告警策略触发关系,告警策略项构成。一条告警规则可绑定某个指定集群或所有集群,拥有一个或多个告警策略。其中,告警策略之间组合关系由“策略触发关系”选项描述。告警规则的阈值触发和抑制条件由每条告警策略描述。
    • 告警策略:为某个告警指标指定的触发条件,抑制条件,告警级别的组合称为告警策略。
    • 告警指标:数据库集群的某个指标项,一般是一个时间序列数据,例如:节点CPU使用率,查询触发下盘量等。
  • 告警规则分类:
    • 默认规则:GaussDB(DWS)阈值告警模块的最佳实践。
    • 自定义规则:用户可自由选择或组合监控指标形成个性化的告警规则。目前版本仅支持用户自定义schema使用率告警规则。
  • 告警规则操作:
    • 修改:修改告警规则的选项。所有告警规则都可以修改编辑,但默认告警规则只能修改部分选项,而自定义告警规则可以修改全部选项。
    • 启用/停用:启用或停用告警规则。所有的告警规则都可以启用/停用,启用后告警规则会被告警引擎纳入检查列表,可以正常触发。停用后的告警规则将被告警引擎移出检查列表,不会触发该规则检查。
    • 删除:删除告警规则。只有自定义告警规则可以被删除,用户无法删除默认告警规则。

注意事项

集群迁移后,若需要监控新集群的告警,可修改告警规则绑定的集群,指向迁移后的集群,也可针对新集群创建新的告警规则。

查看告警规则

  1. 登录GaussDB(DWS) 管理控制台。
  2. 在左侧导航栏,选择“管理 > 告警管理”,默认显示“告警”页签。
  3. 单击左上角的“告警规则管理”按钮,进入告警规则页面。该页面主要用来展示DMS告警模块上配置的数据库集群监控项阈值告警规则。

修改告警规则

  1. 登录GaussDB(DWS) 管理控制台。
  2. 在左侧导航栏,选择“管理 > 告警管理”,切换至“告警”页签。
  3. 单击左上角的“告警规则管理”按钮,进入告警规则页面。
  4. 在指定告警规则名称所在行操作列,单击“修改”按钮进入修改告警规则页面。

    • 只读用户(仅拥有DWS ReadOnlyAccess权限的用户)不支持修改告警规则。
    • 用户只能修改部分默认规则的选项(规则绑定集群、告警策略的触发阈值、数据抓取区间和告警抑制条件),可修改自定义规则的全部选项。
    表1 告警规则参数

    名称

    说明

    样例值

    告警规则名称

    规则名称长度为6到64个字符,且只能是首位非数字的中文、英文、数字、斜线组合。

    -

    规则描述

    自定义描述,不超过490个字符。

    -

    规则绑定集群

    可在该下拉框中选择当前租户下的集群作为告警模块的监控集群。

    所有集群

    策略触发关系

    策略触发关系包括:

    • 相互独立:各个告警策略之间互相独立触发。
    • 按优先级:各个告警策略之间按照排列的先后顺序触发,当高优先级策略触发后低优先级策略就不会再做判断。

    相互独立

    告警策略

    告警策略包括:

    • 指标名称:GaussDB(DWS) 数据仓库的监控指标,告警引擎用来做阈值判断的数据源。
    • 告警对象(自定义告警规则参数):选择的当前集群中包含的数据库,及其已选择的数据库中所包含的SCHEMA。
    • 触发条件:定义对监控指标做阈值判断的计算规则。目前主要使用一段时间内的平均值来降低告警震荡的几率。
    • 抑制条件:在指定的时间段内,抑制同类型告警的反复触发和消除。
    • 告警级别:告警的严重程度,包含紧急、重要、次要和提示。

    -

  5. 确认无误后,单击“确认”。

创建自定义告警规则

  1. 登录GaussDB(DWS) 管理控制台。
  2. 在左侧导航栏,选择“管理 > 告警管理”,切换至“告警”页签。
  3. 单击左上角的“告警规则管理”按钮,进入告警规则页面。
  4. 单击右上角的“创建告警规则”按钮,进入创建告警规则页面。用户可自定义告警规则名称、规则描述、规则绑定集群和告警策略等配置项,详情请参见表1

    目前GaussDB(DWS)只开放schema使用率的自定义告警规则指标。