- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 通过IAM授予使用AOM的权限
- AOM全景监控概览
- 接入AOM
- 接入AOM(新版)
- 可观测指标浏览
- 仪表盘监控
- 告警监控
- 日志管理(新版)
- 日志管理(旧版)
-
Prometheus监控
- Prometheus监控概述
- 管理Prometheus实例
- 管理Prometheus实例指标数据
- 使用Prometheus监控CCE集群指标
- 配置多账号聚合实现指标统一监控
- 配置CCE集群监控采集指标规则
- 配置预聚合规则提升指标查询效率
- 配置数据多写实现监控指标转储到自建Prometheus
- 配置指标存储时长
- 通过仪表盘监控Prometheus实例指标数据
- 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据
- 配置Remote Write地址实现自建Prometheus数据上报到AOM
- 通过Grafana查看Prometheus实例数据
- 查看Prometheus实例指标上报量
- 基础设施监控
- 云服务监控
- 应用监控
- 智能洞察(BETA)
- Web监控
- App监控
- 应用洞察
- 运维管理
- 全局设置
- 查看AOM审计事件
- 迁移AOM 1.0数据至AOM 2.0
- 最佳实践
-
API参考
- 使用前必读
- API概览
- 如何调用API
-
API
-
告警
- 获取告警发送结果
- 删除静默规则
- 新增静默规则
- 修改静默规则
- 获取静默规则列表
- 通过告警规则名称获取告警行动规则
- 新增告警行动规则
- 删除告警行动规则
- 修改告警行动规则
- 获取告警行动规则列表
- 查询事件类告警规则列表
- 新增一条事件类告警规则
- 更新事件类告警规则
- 删除事件类告警规则
- 查询指标类或者事件类告警规则列表
- 添加或修改指标类或事件类告警规则
- 删除指标类或事件类告警规则
- 批量更新Prometheus监控告警规则
- 删除告警规则模板
- 查询告警规则模板列表
- 查询消息通知模板列表
- 删除消息通知模板
- 新增消息通知模板
- 修改消息通知模板
- 根据消息通知模板名称查询消息通知模板
- 查询事件告警信息
- 统计事件告警信息
- 上报事件或告警信息
- 监控
- Prometheus监控
- 日志
- Prometheus实例
- 配置管理
- UniAgent管理
- 仪表盘
- 应用资源管理(即将下线)
- 自动化运维(即将下线)
-
告警
- 历史API
- 应用示例
- 权限策略和授权项
- 附录
- SDK参考
- 场景代码示例
- 常见问题
- 视频帮助
-
AOM 1.0 文档
- 产品介绍(1.0)
- 快速入门(1.0)
- 用户指南(1.0)
- 最佳实践(1.0)
-
常见问题(1.0)
- 用户高频问题
- 常见咨询问题
-
常见使用问题
- 没有消息通知服务的访问权限?
- 资源运行异常怎么办?
- 如何设置全屏模式在线时长?
- 日志配额已达到90%或已满怎么办?
- 如何获取AK/SK?
- 如何查询服务不可用时间?
- AOM告警规则状态为什么显示“数据不足”?
- 正常状态的工作负载,AOM界面显示异常是什么原因?
- 如何创建委托apm_admin_trust?
- 如何通过创建委托获取AK/SK?
- 日志费用说明
- 在控制台查看不到日志怎么办?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 安装了ICAgent,但是监控不到主机是什么原因?
- 安装ICAgent过程中,系统提示“no crontab for root”是什么原因?
- AOM配置日志转储时无法选中obs桶是什么原因?
- Grafana无法展示内容是什么原因?
- 视频帮助(1.0)
- 文档下载
- 通用参考
展开导读
功能总览
-
应用运维管理
-
应用运维管理(Application Operations Management,简称AOM)是云上应用的全栈可观测平台,融合云监控(CES)、云日志(LTS)、应用性能(APM)、用户体验监控(APM)等多维度可观测性数据源,提供指标、日志、调用链数据关联分析能力,帮助用户及时发现故障,全面掌握应用、资源及业务的实时运行状况,提升企业运维的效率。
- 统一接入中心:提供全场景数据接入能力,支持业务层(安卓、IOS、WEB等)、组件层(JAVA、GO等多语言)、中间件层(Redis、MySQL等)、运行环境层(ECS、K8s等)、云服务层、API和开源协议(OpenTelemetry、Kafka等)各种方式接入指标、链路、日志数据;提供UniAgent采集器底座管理,支持各种数据采集插件生命周期管理能力。
- 统一告警管理:提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。
- 统一监控大盘:支持自定义可视化监控大盘,提供表格、折线图、饼图、地图等多种可视化图表,预置30+开箱即用仪表盘。用户可以添加自定义变量和过滤器筛选数据,方便对指标和日志数据进行可视化运营分析。
- Prometheus监控:全面对接开源Prometheus生态,提供全托管的Prometheus服务,支持PromQL查询、可视化指标浏览,支持通过Remote Read和Remote Write方式读取或上报Prometheus数据、支持对接Grafana。
- 基础设施监控:支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。
- 日志管理:提供全场景日志采集、百亿日志秒搜、PB级存储、一站式日志加工、日志SQL可视化分析、日志转储等功能,满足应用运维、安全合规和运营分析等应用场景需求。
- 应用性能&用户体验监控:支持从Web端、App端到应用微服务、数据库、中间件的全链路时延、异常等分析能力,帮助运维人员快速定位链路故障根源,快速发现应用的性能瓶颈,为用户体验保驾护航。
- 云服务监控:为用户提供针对弹性云服务器、带宽等云服务资源的监控能力,帮助您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。
-
-
接入中心
-
提供全场景数据接入能力,支持业务层(安卓、IOS、WEB等)、组件层(JAVA、GO等多语言)、中间件层(Redis、MySQL等)、运行环境层(ECS、K8s等)、云服务层、API和开源协议(OpenTelemetry、Kafka等)各种方式接入指标、链路、日志数据;提供UniAgent采集器底座管理,支持各种数据采集插件生命周期管理能力。
发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华东-上海一、华东-上海二、华东-青岛、华东二、华南-广州、华南-深圳、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、非洲-约翰内斯堡、土耳其-伊斯坦布尔、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥
-
-
仪表盘
-
支持自定义可视化监控大盘,提供表格、折线图、饼图、地图等多种可视化图表,预置30+开箱即用仪表盘。用户可以添加自定义变量和过滤器筛选数据,方便对指标和日志数据进行可视化运营分析。
发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华东-上海一、华东-上海二、华东-青岛、华东二、华南-广州、华南-深圳、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、非洲-约翰内斯堡、土耳其-伊斯坦布尔、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥
-
-
告警管理
-
提供Prometheus、日志、云服务统一告警规则管理,统一告警模板管理,统一告警通知对象管理;预置100+告警模板,支持告警分组、抑制、静默等多种降噪方式,支持自定义消息模板和多种通知渠道(邮件、短信、语音、企业微信、钉钉、飞书、Webhook)。
发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华东-上海一、华东-上海二、华东-青岛、华东二、华南-广州、华南-深圳、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、非洲-约翰内斯堡、土耳其-伊斯坦布尔、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥
-
-
日志管理
-
提供全场景日志采集、百亿日志秒搜、PB级存储、一站式日志加工、日志SQL可视化分析、日志转储等功能,满足应用运维、安全合规和运营分析等应用场景需求景。
发布区域:华北-北京一,华南-深圳,西南-贵阳一,华北-北京四,亚太-新加坡,非洲-约翰内斯堡,华东-上海一,华北-乌兰察布一,华北-乌兰察布二零二、拉美-圣地亚哥,拉美-圣保罗一,拉美-墨西哥城一,拉美-墨西哥城二,亚太-雅加达,土耳其-伊斯坦布尔,华北-乌兰察布-汽车一,中东-利雅得,华东-青岛,华东-上海二,华南-广州,华北-北京二,中国-香港,亚太-曼谷、华东二区域开放
-
-
Prometheus监控
-
全面对接开源Prometheus生态,提供全托管的Prometheus服务,支持PromQL查询、可视化指标浏览,支持通过Remote Read和Remote Write方式读取或上报Prometheus数据、支持对接Grafana。
发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华东-上海一、华东-上海二、华东-青岛、华东二、华南-广州、华南-深圳、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、非洲-约翰内斯堡、土耳其-伊斯坦布尔、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥
-
-
基础设施监控
-
支持采集主机(进程)、容器(工作负载、POD等)的监控数据,查看基础设施对象的可观测数据(例如主机的CPU使用率、内存使用率、磁盘使用率、主机上的日志等),并支持监控数据之间的关联分析。
发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华东-上海一、华东-上海二、华东-青岛、华东二、华南-广州、华南-深圳、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、非洲-约翰内斯堡、土耳其-伊斯坦布尔、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥
-
-
应用性能&用户体验监控
-
云服务监控
-
提供针对弹性云服务器、带宽等云服务资源的监控能力,帮助您全面了解云上的资源使用情况、业务的运行状况,并及时收到异常告警做出反应,保证业务顺畅运行。
发布区域:华南-广州
-
-
设置
-
AOM提供云服务授权,认证管理、全局开关、数据订阅、采集设置功能。通过云服务授权您可以为当前用户一键授予云服务数据的访问权限;通过认证管理您可以创建AccessCode并为当前用户配置API服务的调用权限;通过全局开关您可以控制指标采集开关和告警消息内容显示资源的TMS标签开关;通过数据订阅您可以订阅指标或者告警信息;通过采集设置您可以管理UniAgent和采集插件,对CCE集群下的采集器统一管理,对主机组、代理区域进行管理,以及查看UniAgent以及插件的操作日志等。
发布区域:华北-乌兰察布-汽车一、华北-乌兰察布一、华北-乌兰察布二零一、华北-乌兰察布二零二、中东-利雅得、华北-北京一、华北-北京四、华北-北京二、华东-上海一、华东-上海二、华东-青岛、华东二、华南-广州、华南-深圳、西南-贵阳一、中国-香港、亚太-曼谷、亚太-新加坡、亚太-雅加达、非洲-约翰内斯堡、土耳其-伊斯坦布尔、拉美-墨西哥城一、拉美-墨西哥城二、拉美-圣保罗一和拉美-圣地亚哥
-