- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 通过IAM授予使用AOM的权限
- 接入AOM
- 接入AOM(新版)
- 可观测指标浏览
- 仪表盘监控
- 告警监控
- 日志管理(新版)
- 日志管理(旧版)
-
Prometheus监控
- Prometheus监控概述
- 管理Prometheus实例
- 管理Prometheus实例指标数据
- 使用Prometheus监控CCE集群指标
- 配置多账号聚合实现指标统一监控
- 配置CCE集群监控采集指标规则
- 配置预聚合规则提升指标查询效率
- 配置数据多写实现监控指标转储到自建Prometheus
- 配置指标存储时长
- 通过仪表盘监控Prometheus实例指标数据
- 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据
- 配置Remote Write地址实现自建Prometheus数据上报到AOM
- 通过Grafana查看Prometheus实例数据
- 查看Prometheus实例指标上报量
- 基础设施监控
- 云服务监控
- 应用监控
- 智能洞察(BETA)
- Web监控
- App监控
- 应用洞察
- 运维管理
- 全局设置
- 查看AOM审计事件
- 迁移AOM 1.0数据至AOM 2.0
- 最佳实践
-
常见问题
- 仪表盘
- 告警管理
- 日志分析
- Prometheus监控
- 基础设施监控
- 应用监控
-
采集管理
- ICAgent和UniAgent是同一个插件吗?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 在主机上手工安装ICAgent后提示安装成功,但UniAgent安装与配置界面显示状态异常?
- ICAgent安装成功后,无法在界面上获取到ICAgent状态
- ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息
- 如何获取AK/SK?
- UniAgent和ICAgent安装类常见问题
- 如何在VPCEP控制台为AOM/LTS创建终端节点?
- 如何启用NGINX stub_status模块?
- APM指标数据未采集上来,可能有哪些原因?
- ECS主机上执行UniAgent安装命令,下载安装脚本失败
- 应用资源管理(即将下线)
- 运维管理(即将下线)
- 其他常见问题
- 视频帮助
- API参考
- SDK参考
- 场景代码示例
-
AOM 1.0 文档
- 产品介绍(1.0)
- 快速入门(1.0)
- 用户指南(1.0)
- 最佳实践(1.0)
-
常见问题(1.0)
- 用户高频问题
- 常见咨询问题
-
常见使用问题
- 没有消息通知服务的访问权限?
- 资源运行异常怎么办?
- 如何设置全屏模式在线时长?
- 日志配额已达到90%或已满怎么办?
- 如何获取AK/SK?
- 如何查询服务不可用时间?
- AOM告警规则状态为什么显示“数据不足”?
- 正常状态的工作负载,AOM界面显示异常是什么原因?
- 如何创建委托apm_admin_trust?
- 如何通过创建委托获取AK/SK?
- 日志费用说明
- 在控制台查看不到日志怎么办?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 安装了ICAgent,但是监控不到主机是什么原因?
- 安装ICAgent过程中,系统提示“no crontab for root”是什么原因?
- AOM配置日志转储时无法选中obs桶是什么原因?
- Grafana无法展示内容是什么原因?
- 视频帮助(1.0)
- 文档下载
- 通用参考
链接复制成功!
Prometheus监控概述
Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。
Prometheus是一套开源的监控报警系统。主要特点包括多维数据模型、灵活查询语句PromQL以及数据可视化展示等。更多信息请参见Prometheus官方文档。
Prometheus实例是AOM服务提供的管理Prometheus数据采集和数据存储分析的逻辑单元。根据Prometheus监控的对象和使用场景,Prometheus实例可以分为以下几种类型,具体请参见表1。
Prometheus实例类型 |
监控对象 |
监控能力 |
应用场景 |
---|---|---|---|
default |
|
提供通过API和ICAgent上报到AOM的指标的监控。 |
不区分使用场景,既适合作为自建Prometheus 的远程存储(Remote Write)场景,也适合接入容器、云服务、主机等指标数据的场景。 |
Prometheus实例 for CCE |
CCE |
|
适合需要对容器服务集群及其上面运行的应用进行一体化监控场景。 |
Prometheus实例 for ECS |
ECS |
通过在VPC内的某台虚机上安装uniagent(Exporter)插件提供针对此VPC内ECS应用和组件(如数据库,中间件等)的一体化监控。 |
适合需要对运行在华为云的虚拟私有云VPC内(通常为弹性云服务器ECS集群)的应用组件进行监控场景,可以通过接入中心添加Prometheus中间件及自定义插件监控。 |
Prometheus实例 for 云服务 |
多种云服务 |
提供多种云服务的监控。一个企业项目下只支持创建一个“Prometheus for 云服务”类型的Prometheus实例。 |
适合需要通过Prometheus监控来统一采集、存储和显示云服务的监控数据的场景。 |
Prometheus实例 通用实例 |
自建的Prometheus |
适合已经自建了Prometheus Server,但需要通过远端存储(Remote Write)方式来解决数据存储问题的可用性和可扩展性场景。 |
|
Prometheus实例 for 多账号聚合实例 |
同一个组织下多账号的云服务资源、CCE资源和ECS资源 |
支持对同一个组织下多账号的云服务资源、CCE、ECS数据聚合,运维监控。 通过该Prometheus实例接入的指标如下: |
适合需要统一监控同一个组织下多成员账号的云服务资源、CCE资源、ECS资源的场景。 |
Prometheus for APM |
APM调用链 |
集成APM应用监控能力,支持对JAVE、GO、Python、Node.js,PHP、.NET、C++等应用层组件调用链指标进行监控。 |
适合已开通云应用性能指标监控(APM)服务,监控应用组件调用链指标的场景。 |
功能特性
AOM的Prometheus监控具有监控数据采集、存储、计算、展示、告警等能力。监控指标覆盖广,涵盖容器、云服务、中间件、数据库、应用以及业务等多种监控数据。AOM的Prometheus监控支持的主要功能如下所示。
功能 |
功能说明 |
---|---|
AOM支持创建多种类型的Prometheus实例。您可以根据需求选择创建任一类型的Prometheus实例。 |
|
AOM集成容器服务CCE集群的Prometheus云原生监控插件,支持在Prometheus实例的“集成中心”为CCE集群安装云原生监控插件,上报指标到指定的CCE类型Prometheus实例中。 当前仅CCE类型Prometheus实例支持。 |
|
AOM集成Prometheus中间件插件,支持在Prometheus实例的“接入中心”为虚机安装中间件Exporter,将上报指标到指定的ECS Prometheus实例中。 当前仅ECS类型Prometheus实例支持。 |
|
AOM支持在Prometheus实例的“云服务接入”中将云服务接入AOM,将云服务关指标上报到定的云服务Prometheus实例中。 当前仅云服务类型Prometheus实例支持。 |
|
AOM支持在Prometheus实例的“接入账号”中将同一组织下多个成员账号接入AOM后,实现对同一组织下多个成员账号的云服务指标进行监控。通过数据多写功能,可以实现跨VPC的访问,而不必暴露服务端相关的网络信息。 |
功能 |
功能说明 |
---|---|
支持查看、新增和废弃指标。 当前仅default类型、CCE类型、云服务类型、ECS类型、通用实例类型的Prometheus实例支持。 |
功能 |
功能说明 |
---|---|
使用Remote Read地址和Remote Write地址,将自建Prometheus的监控数据存储到AOM的Prometheus实例中,实现远程存储。 |
|
通过配置预聚合规则将计算过程提前到写入端,可减少查询端资源占用,尤其在大规模集群和复杂业务场景下可以有效的降低PromQL的复杂度,从而提高查询性能,解决用户配置以及查询慢的问题。 当前仅CCE类型Prometheus实例支持。 |
|
通过数据多写功能,可以实现跨VPC的访问。 |
产品优势
开箱即用
|
低成本
|
开源兼容
|
数据规模无上限
|
高性能
|
高可用性
|
基本概念
本文汇总使用Prometheus监控过程中涉及的基本概念,方便您查询和了解相关概念。
概念 |
说明 |
---|---|
Exporter |
一个采集监控数据并通过Prometheus监控功能规范对外提供数据的组件。目前有上百个官方或者第三方 Exporter可供使用,具体请参见Exporter详情。 |
Target |
Prometheus探针要抓取的采集目标。采集目标暴露自身运行、业务指标,或者代理暴露监控对象的运行、业务指标。 |
Job |
一组Target的配置集合。定义了抓取间隔,访问限制等作用于一组Target的抓取行为。 |
Prometheus 监控 |
Prometheus监控全面对接开源Prometheus生态,支持类型丰富的组件监控,提供多种开箱即用的预置监控大盘和全面托管的Prometheus服务。 |
Prometheus监控功能提供的管理Prometheus数据采集和数据存储分析的逻辑单元。 |
|
Prometheus探针 |
部署在用户侧或者云产品侧Kubernetes集群。负责自动发现采集目标、采集指标和远程写到其他库。 |
PromQL |
Prometheus监控的查询语言。支持瞬时查询和时间跨度查询,内置多种函数和操作符。可以对原始数据进行聚合、切片、预测和联合。 |
Sample |
一条时间线在某个时间点对应的数值。在Prometheus监控服务中,每个Sample由一个float64数据类型的值和一个毫秒精度的时间戳构成。 |
告警规则 |
Prometheus监控Alerting Rule格式的告警配置。可以通过PromQL描述。 |
标签 |
描述指标的一组Key-Value值。 |
指标管理 |
Prometheus监控的功能特点之一,无需静态配置,可以自动发现采集目标。支持Kubernetes SD、Consul、Eureka等多种指标管理方式,支持通过ServiceMonitor、PodMonitor的方式暴露采集目标。 |
预聚合 |
Prometheus监控的Recording Rule能力。可以通过PromQL将原始数据加工成新的指标,提升查询效率。 |
时间序列 |
由指标名和标签组成。属于同一指标和同一组标签维度的带时间戳的流。 |
远程存储 |
自研的时序数据存储组件。支持Prometheus监控的Remote Write协议,由云产品全面托管。 |
云产品监控 |
无缝集成了多种云产品的监控数据。用户如果有云产品的监控需求,可以通过接入云产品监控实施。 |
指标 |
采集目标暴露的、可以完整反映监控对象运行或者业务状态的一系列标签化数据。Prometheus监控采用OpenMetrics的标准数据格式描述指标。 |