更新时间:2024-12-20 GMT+08:00
分享

AOM最佳实践汇总

本文汇总了应用运维管理(AOM,Application Operations Management)常见应用场景的操作实践,为每个实践提供详细的方案描述和操作指导,帮助用户轻松使用AOM。

表1 AOM 最佳实践一览表

最佳实践

说明

通过AOM告警分组规则清除ELB告警风暴

本文档介绍如何为告警规则配置告警降噪功能,在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。

通过多账号聚合Prometheus实例实现指标数据统一监控

本文档介绍通过配置统一监控告警,同时监控不同账号下的指标数据。

自定义OS镜像自动接入采集管理器Uniagent

本文档介绍如何在Linux环境和Windows环境下,基于应用运维服务的采集管理器Uniagent进行镜像打包。您可以使用打包的镜像购买新的ECS主机,就可以为该主机自动安装采集管理器Uniagent。

CCE容器场景自建中间件接入AOM实现指标监控

Prometheus监控服务提供了多种常用中间件Exporter,由于AOM兼容原生Prometheus,您可以通过安装社区中的Exporter,将CCE容器场景自建中间件接入AOM。

第三方云厂商或互联网数据中心自建Prometheus对接到AOM Prometheus实例

云上用户经常会遇到多云或者跨region采集自建Prometheus指标数据场景。典型场景例如:将者第三方云厂商或互联网数据中心(Internet Data Center,以下简称IDC)的自建Prometheus对接到AOM的 Prometheus实例中。

将AOM仪表盘详情页面嵌入用户自建系统

AOM支持将仪表盘图表页面嵌入到客户自建系统。通过统一身份认证服务IAM的联邦代理机制实现用户自定义身份代理,再将登录链接嵌入至用户自建系统实现无需在华为云官网登录就可在自建系统界面查看AOM仪表盘图表页面。

通过华为云标签(Tag)分发告警

通过配合使用Prometheus监控和告警管理功能,可以按照华为云标签对资源进行告警。本文演示如何通过标签对DCS实例的CPU利用率指标进行告警。

相关文档