AOM告警监控概述
AOM提供告警监控能力。告警是指AOM自身或外部服务在异常情况、可能导致异常情况下上报的信息,需要您采取相应措施清除故障,否则会由于AOM自身或外部服务的功能异常而引起业务的异常。事件是指AOM自身或外部服务发生了某种变化,但不一定会引起业务异常情况下上报的信息,您可根据需要对事件进行处理。
功能说明
- 告警通知:通过创建通知规则关联接收对象、SMN主题与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联的接收对象、SMN主题与消息模板来发送告警通知。
- 告警降噪:在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。
- 告警规则:通过创建告警或事件规则,实时监控资源使用情况。
- 查看告警或事件:提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。
约束与限制
- AOM 2.0融合CES相关功能后,会向AOM FullAccess策略中添加“CES:*:*”,“ecs:instance:list”,“dms:instance:list”,“dms:instance:get”,“lts:topics:list”,“lts:groups:list”,“smn:topic:list”,“smn:topic:publish”,“swr:repository:*”,“swr:repo:*”,“vpc:bandwidths:get”,“as:groups:get”,“astrocanvas:*:*”细粒度权限,若您之前通过AOM FullAccess策略对租户下子用户进行了权限控制,那么AOM FullAccess策略增加上述权限后,子用户也会展示上述云服务资源,您若仍有子用户云服务资源控制诉求,则您可自行进行自定义的子用户权限配置,从而达成子用户云服务资源展示控制效果。