批量创建AOM云服务告警规则
Prometheus监控告警模板是一组以模板组为单位的告警规则模板组合。AOM提供Prometheus监控告警模板功能,支持使用告警模板批量关联到Prometheus实例和集群中,方便快速为Prometheus实例和集群创建告警规则。AOM预置多种默认Prometheus监控告警模板,同时支持根据需要创建自定义告警模板。
约束与限制
您最多可创建150个告警模板,如果告警模板数量已达到150个,请删除不需要的告警模板后重新创建。
背景信息
AOM预置多种默认模板组,模板组中包含多个Prometheus监控告警模板,显示在“告警模板”界面的“Prometheus监控”的“ 默认告警模板”子页签下,供您选择使用。
创建Prometheus监控自定义模板组
- 登录AOM 2.0控制台。
- 在左侧导航栏中选择“告警中心 > 告警模板”。
- 在 “告警模板”页面中按照如下入口创建Prometheus监控自定义告警模板组(二选一):
- 切换至“Prometheus监控”下的“ 自定义告警模板”子页签,单击
,然后设置告警模板组的基本信息。“默认告警模板”子页签下的模板组是预置模板组,不支持创建新的默认模板组。 - 单击页面右上角“创建自定义模板”,在“选择告警来源”弹框中选择“Prometheus监控”并单击 “创建自定义模板”,然后设置告警模板组的基本信息。
- 切换至“Prometheus监控”下的“ 自定义告警模板”子页签,单击
- 设置告警模板组的基本信息。具体的参数说明如表1所示。
表1 告警模板组填写说明 参数名称
说明
模板组名称
告警模板组的名称。
最多可输入100个字符,只能包含大小写字母,数字,特殊字符(_-)和中文组成,不能以特殊字符开头结尾。
企业项目
所属的企业项目。
- 如果在全局页面设置为“ALL”,此处请从下拉列表中选择企业项目。
- 如果在全局页面已选择企业项目,则此处灰化不可选。
- 在创建告警消息模板过程中,如果要选择刚新创建的企业项目,建议企业项目创建后等待10分钟左右,再进行告警消息模板创建。
描述(可选)
告警模板组的描述信息,最多可输入1024个字符。
变量
变量使用在告警模板的查询语句中。例如在cpu_usage{clusterId=${clusterId}}查询语句中替换${clusterId}对应的值。
单击“添加变量”,配置变量的变量键和变量值。最多可以配置50个变量。
其中变量键输入的长度不能超过32个字符,只能包含字母、数字、下划线。变量值输入的长度不能超过1024个字符。
- 设置完成后,单击“确定”。
自定义模板组创建完成后,您可以根据实际需求对模板组执行如下相关操作:
表2 相关操作说明 操作
说明
创建模板
为自定义模板组创建告警规则模板。
选择目标模板组,在“告警规则模板”区域单击“创建模板”为该模板组创建告警规则模板,详情请参考创建Prometheus监控自定义告警规则模板。(默认告警模板组不支持创建告警规则模板。)
使用模板组
批量使用默认模板组或自定义模板组中的告警规则模板 ,将模板组中的所有告警规则模板关联到Prometheus实例和集群中。
选择目标模板组,在右侧模板组信息弹框中单击“使用模板组”,详情请参考使用Prometheus监控模板组中的告警规则模板。
复制
新复制的模板组会展示在“ 自定义模板组”子页签,您可以对模板组中的告警规则模板内容进行定制修改。- 复制预置的默认模板组:单击“Prometheus监控”下的“默认告警模板”子页签,在“默认模板组”区域选择待复制的模板组,然后在右侧模板组信息弹框中单击“复制”,配置模板组名称,企业项目和描述信息,即可复制默认的模板组。
- 复制已创建的自定义模板组:单击“Prometheus监控”下的“自定义告警模板”子页签,在“自定义模板组”区域选择待复制的模板组,然后在右侧模板组信息弹框中单击“更多 > 复制”,配置模板组名称,企业项目和描述信息,即可复制自定义的模板组。
编辑
修改自定义模板组信息。
在“自定义模板组”区域选择待修改的模板组,然后在右侧模板组信息弹框中单击“更多”下方的“编辑”,即可修改自定义模板组信息。(默认告警模板组不支持修改模板组信息。)
删除
删除自定义模板组。
在“自定义模板组”区域选择待修改的模板组,然后在右侧模板组信息弹框中单击“更多”下方的“删除”,即可删除自定义模板组信息。(默认告警模板组不支持删除模板组。)
导出
导出自定义模板组文件。如果其他区域或用户需要复用已创建的自定义模板组中的告警规则模板,可先导出该模板组文件,然后通过导入模板组文件即可快速复用模板组中的告警规则模板。
选择待导出的模板组,在右侧模板组信息弹框中单击“导出”,即可导出自定义模板组的告警规则模板JSON文件。
导入
导入模板组文件。如果其他区域或用户需要复用告警规则模板,可先导出该模板组文件,然后通过导入模板组文件快速复用模板组中的告警规则模板。
在“默认模板组”或“自定义模板组”区域,单击
,配置如下信息:
- 模板组名称。最多可输入100个字符,只能包含中文、字母、数字、下划线和中划线,开头、结尾不允许输入下划线或中划线。
- 企业项目所属的企业项目,可在下拉列表中选择。
- 点击上传或直接拖入导出的JSON文件。
- 单击“创建”。
创建Prometheus监控自定义告警规则模板
- 登录AOM 2.0控制台。
- 在左侧导航栏中选择“告警中心 > 告警模板”。
- 切换至“Prometheus监控”下的“ 自定义告警模板”子页签,选择目标模板组。
- 在“告警规则模板”区域单击“创建模板”,配置告警规则模板的基本信息。具体的参数说明如表3所示。
- 设置告警模板规则的详细信息和高级配置信息。
- “规则类型”设置为“指标告警规则”,配置详情请参考:创建AOM指标告警规则。(创建告警规则时不支持配置告警通知。)
- “规则类型”设置为“事件告警规则”,配置详情请参考:创建AOM事件告警规则。(创建告警规则时不支持配置告警通知。)
- 设置完成后,单击“确定”。
自定义告警规则模板创建完成后,您可以根据实际需求在“告警规则模板”区域执行如下相关操作:
表4 相关操作说明 操作
说明
查看告警规则模板
查看默认模板组或自定义模板组中的告警规则模板。
选择模板组,在“告警规则模板”区域的搜索框设置查询条件属性查询告警规则模板,支持按照告警规则模板名称和关联告警数进行过滤查询。
设置告警规则模板列表
单击列表右上角的
按钮,在“设置”弹框中对列表进行自定义设置。
- 基础设置
- 表格内容折行:默认为启用状态。启用此功能可以让列表页中的内容在显示时自动换行。禁用此功能可截断文本,列表页中仅显示部分内容。
- 表格数据列固定:可选择“不固定”、“固定第一列”或“固定前两列”,按需固定数据列。
- 表格操作列固定:勾选“固定操作列”后,可让操作列固定在最后一列永久可见。
- 自定义显示列:通过选中或取消选中“自定义显示列”前的复选框,自定义可选列的展示与隐藏。
批量使用模板
将默认模板组或自定义模板组中所选的多个告警规则模板批量关联到Prometheus实例和集群中。
选择模板组,在“告警规则模板”区域勾选一个或多个待使用的告警规则模板,然后单击上方“批量使用模板”,详情请参考使用Prometheus监控模板组中的告警规则模板。
使用模板
将默认模板组或自定义模板组中所选的一条告警规则模板关联到Prometheus实例和集群中。
选择模板组,在“告警规则模板”区域勾选待使用的告警规则模板,然后单击操作列的“使用模板”,详情请参考使用Prometheus监控模板组中的告警规则模板。
复制模板
复制自定义模板组中已创建的告警规则模板。
选择模板组,在“告警规则模板”区域勾选待复制的告警规则模板,然后单击操作列的“更多 > 复制”,修改模板信息,即可复制告警规则模板。
删除模板
删除自定义模板组中已创建的告警规则模板。
- 选择模板组,在“告警规则模板”区域勾选一个或多个待删除的模板,然后单击上方“删除模板”,即可批量删除告警规则模板。
- 选择模板组,在“告警规则模板”区域勾选待删除的告警规则模板,然后单击操作列的“更多 > 删除”,即可删除告警规则模板。
编辑
修改自定义模板组中已创建的告警规则模板信息。
选择模板组,在“告警规则模板”区域勾选待修改的告警规则模板,,然后单击操作列的“编辑”,即可修改告警规则模板。
- 基础设置
使用Prometheus监控模板组中的告警规则模板
- 登录AOM 2.0控制台。
- 在左侧导航栏中选择“告警中心 > 告警模板”。
- 切换至“Prometheus监控”下的“默认告警模板”或“自定义告警模板”子页签。
- 使用模板组:在“默认模板组”或“自定义模板组”区域,选择待使用的模板组,单击“使用模板组”,然后配置使用告警模板信息,即可将该模板组中的所有告警规则模板关联到Prometheus实例和集群中。
- 批量使用模板:在“默认模板组”或“自定义模板组”区域,选择模板组,在“告警规则模板”区域勾选多个待使用的模板,单击上方“批量使用模板”,然后配置使用告警模板信息,即可将模板组中的多个告警规则模板批量关联到Prometheus实例和集群中。
- 使用模板:在“默认模板组”或“自定义模板组”区域,选择模板组,单击“告警规则模板”区域中某条告警规则模板操作列的“使用模板”,然后配置使用告警模板信息,即可将模板组中的该条告警规则模板关联到Prometheus实例和集群中。
- 配置使用告警模板信息。具体的参数说明如使用告警模板填写说明所示。
表5 使用告警模板填写说明 参数名称
说明
Prometheus实例
请从下拉列表中选择需要关联的Prometheus实例。除CCE类型模板组外的其他模板组中的告警规则模板支持关联Prometheus实例。
- 取消Prometheus实例关联会删除对应的告警规则。
- 系统将根据您选择的Prometheus实例还有集群作为数据资源,创建、修改、删除告警规则,告警规则原始名称为:{告警规则模板名称}_{告警规则模板组名称}_{Prometheus实例/集群ID}_{36位随机数}。
集群
请从下拉列表中选择需要关联的CCE集群。仅CCE类型模板组中的告警规则模板支持关联CCE集群。
- 取消集群关联会删除对应的告警规则。
- 系统将根据您选择的Prometheus实例还有集群作为数据资源,创建、修改、删除告警规则,告警规则原始名称为:{告警规则模板名称}_{告警规则模板组名称}_{Prometheus实例/集群ID}_{36位随机数}。
- 如果需要为告警模板规则关联CCE集群,需提前获取CCE的相关权限,详情请参见CCE权限管理。
新规则所属的企业项目
选择企业项目。不会修改已存在告警规则的企业项目,仅适用于新创建的告警规则。
更新该模板关联的告警规则
是否更新该模板关联的告警规则。- 开启:将使用告警规则模板更新相关联的已存在的告警规则。默认开启。
- 关闭:不会更新告警模板关联的已存在的告警规则。
通知场景
设置发送告警通知的场景。
- 告警触发时:满足告警触发条件,则以邮件、短信等方式发送告警通知给指定人员。
- 告警恢复时:满足告警恢复条件,则以邮件、短信等方式发送告警通知给指定人员。
告警方式
- 直接告警:满足告警条件,直接发送告警。选择“直接告警”方式,需要设置通知频率和是否启用通知规则。
- 告警降噪:对告警信息自动匹配告警降噪分组规则后再发送告警,防止产生告警风暴。选择“告警降噪”方式,需要设置是否启用分组规则。
通知频率
选择发送告警通知的频率,请根据需要从下拉列表中选择。
通知规则
请开启通知规则开关并选择通知规则(当通知规则开关关闭时,无法使用模板)。系统根据关联SMN主题与消息模板来发送告警通知。如果现有列表中的告警通知规则无法满足需要,可在下拉列表中单击“新建告警通知规则”添加,具体操作请参见创建AOM告警通知规则。
分组规则
启用分组规则后,请从下拉列表选择告警降噪的分组规则。如果现有的分组规则无法满足需要,可在下拉列表中单击“新建分组规则”添加,具体操作请参见创建AOM分组规则。
- 设置完成后,单击“确定”。