- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 通过IAM授予使用AOM的权限
- 接入AOM
- 接入AOM(新版)
- 可观测指标浏览
- 仪表盘监控
- 告警监控
- 日志管理(新版)
- 日志管理(旧版)
-
Prometheus监控
- Prometheus监控概述
- 管理Prometheus实例
- 管理Prometheus实例指标数据
- 使用Prometheus监控CCE集群指标
- 配置多账号聚合实现指标统一监控
- 配置CCE集群监控采集指标规则
- 配置预聚合规则提升指标查询效率
- 配置数据多写实现监控指标转储到自建Prometheus
- 配置指标存储时长
- 通过仪表盘监控Prometheus实例指标数据
- 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据
- 配置Remote Write地址实现自建Prometheus数据上报到AOM
- 通过Grafana查看Prometheus实例数据
- 查看Prometheus实例指标上报量
- 基础设施监控
- 云服务监控
- 应用监控
- 智能洞察(BETA)
- Web监控
- App监控
- 应用洞察
- 运维管理
- 全局设置
- 查看AOM审计事件
- 迁移AOM 1.0数据至AOM 2.0
- 最佳实践
-
常见问题
- 仪表盘
- 告警管理
- 日志分析
- Prometheus监控
- 基础设施监控
- 应用监控
-
采集管理
- ICAgent和UniAgent是同一个插件吗?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 在主机上手工安装ICAgent后提示安装成功,但UniAgent安装与配置界面显示状态异常?
- ICAgent安装成功后,无法在界面上获取到ICAgent状态
- ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息
- 如何获取AK/SK?
- UniAgent和ICAgent安装类常见问题
- 如何在VPCEP控制台为AOM/LTS创建终端节点?
- 如何启用NGINX stub_status模块?
- APM指标数据未采集上来,可能有哪些原因?
- ECS主机上执行UniAgent安装命令,下载安装脚本失败
- 应用资源管理(即将下线)
- 运维管理(即将下线)
- 其他常见问题
- 视频帮助
- API参考
- SDK参考
- 场景代码示例
-
AOM 1.0 文档
- 产品介绍(1.0)
- 快速入门(1.0)
- 用户指南(1.0)
- 最佳实践(1.0)
-
常见问题(1.0)
- 用户高频问题
- 常见咨询问题
-
常见使用问题
- 没有消息通知服务的访问权限?
- 资源运行异常怎么办?
- 如何设置全屏模式在线时长?
- 日志配额已达到90%或已满怎么办?
- 如何获取AK/SK?
- 如何查询服务不可用时间?
- AOM告警规则状态为什么显示“数据不足”?
- 正常状态的工作负载,AOM界面显示异常是什么原因?
- 如何创建委托apm_admin_trust?
- 如何通过创建委托获取AK/SK?
- 日志费用说明
- 在控制台查看不到日志怎么办?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 安装了ICAgent,但是监控不到主机是什么原因?
- 安装ICAgent过程中,系统提示“no crontab for root”是什么原因?
- AOM配置日志转储时无法选中obs桶是什么原因?
- Grafana无法展示内容是什么原因?
- 视频帮助(1.0)
- 文档下载
- 通用参考
链接复制成功!
普罗语句说明
AOM对接了PromQL(Prometheus Query Language)语言,该语言内置了丰富的函数,用户可使用该内置函数对指标数据筛选和聚合。 按普罗语句添加指标时,用户可通过普罗语句自定义汇聚指标。
普罗语句语法
普罗语句语法详情可登录prometheus官网查看。
普罗语句查询举例说明
- 示例一:集群下指定pod占所在节点(不含控制节点)的内存使用率
- 定义变量:
- pod中容器内存实际占用量(同一个Pod下可能会有多个容器/实例):aom_container_memory_used_megabytes
- node内存实际总量:aom_node_memory_total_megabytes
- 查询逻辑:
- 针对指标aom_container_memory_used_megabytes,使用聚合函数sum,按照nodeIP和podID进行指定node下指定pod当前的内存实际占用量计算。
- 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。
- 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
- 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。
- pod的内存实际使用率的普罗语句如下所示:
sum(aom_container_memory_used_megabytes{podID="****1461-41d8-****-bfeb-fc1213****",nodeIP="***.***.***.***"}) by (nodeIP) / sum(aom_node_memory_total_megabytes{nodeIP="***.***.***.***"}) by (nodeIP)
- 定义变量:
- 示例二:集群下指定pod占所在节点(不含控制节点)的cpu使用率
- 定义变量:
- pod中容器的cpu实际使用量:aom_container_cpu_used_core
- node的cpu实际总量:aom_node_cpu_limit_core
- 查询逻辑:
- 针对指标aom_container_cpu_used_core,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前使用的cpu使用率。
- 针对指标aom_node_cpu_limit_core,使用聚合函数sum,按照nodeIP计算出指定node的cpu总量。
- 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
- 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际使用率。
- 定义变量:
- 示例三:集群下运行的Pod内存配额申请值 / 集群下该Pod所在节点的内存可分配量
- 定义变量:
- pod中给容器分配的内存总量:aom_container_memory_request_megabytes
- node内存实际总量:aom_node_memory_total_megabytes
- 查询逻辑:
- 针对指标aom_container_memory_request_megabytes,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前被分配的内存总量。
- 针对指标aom_node_memory_total_megabytes,使用聚合函数sum,按照nodeIP计算出指定node的内存总量。
- 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
- 将上述两者获得的指标值进行“/”运算,即可获得pod的内存实际分配率。
- 定义变量:
- 示例四:集群下运行的Pod的cpu配额申请值 / 集群下该Pod所在节点的cpu可分配量
- 定义变量:
- pod中容器的cpu实际分配总量:aom_container_cpu_limit_core
- node的cpu实际分配总量:aom_node_cpu_limit_core
- 查询逻辑:
- 针对指标aom_container_cpu_limit_core,使用聚合函数sum,按照nodeIP和podID计算指定node下指定pod当前使用的cpu分配量。
- 针对指标aom_node_cpu_limit_core,使用聚合函数sum,按照nodeIP计算出指定node的cpu总量。
- 两者均采用(by nodeIP)进行过滤,以使获得的指标值具有相同的指标维度。(仅value不同)
- 将上述两者获得的指标值进行“/”运算,即可获得pod的cpu实际分配率。
- 定义变量:
常用的普罗命令
常用的查询指标的普罗命令如表1所示,用户可根据实际修改其中的IP地址、ID等参数信息。
指标 |
标签定义 |
PromQL |
---|---|---|
主机CPU使用率 |
{nodeIP="",hostID=""} |
aom_node_cpu_usage{nodeIP="192.168.57.93",hostID="ca76b63f-dbf8-4b60-9c71-7b9f13f5ad61"} |
主机应用请求吞吐量 |
{aomApplicationID="",aomApplicationName=""} |
http_requests_throughput{aomApplicationID="06dc9f3b0d8cb867453ecd273416ce2a",aomApplicationName="root"} |
主机应用请求成功率 |
{appName="",serviceID="",clusterId=""} |
http_requests_success_rate{aomApplicationID="06dc9f3b0d8cb867453ecd273416ce2a",aomApplicationName="root" |
主机组件CPU使用率 |
{appName="",serviceID="",clusterId=""} |
aom_process_cpu_usage{appName="icagent",serviceID="2d29673a69cd82fabe345be5f0f7dc5f",clusterId="00000000-0000-0000-0000-00000000"} |
主机进程线程数 |
{processCmd=""}{processID=""}{processName=""} |
aom_process_thread_count{processCmd="cdbc06c2c05b58d598e9430fa133aff7_b14ee84c-2b78-4f71-9ecc-2d06e053172c_ca4d29a846e9ad46a187ade88048825e",processName="icwatchdog"} |
集群磁盘使用率 |
{clusterId="",clusterName=""} |
aom_cluster_disk_usage{clusterId="4ba8008c-b93c-11ec-894a-0255ac101afc",clusterName="servicestage-test"} |
集群虚拟内存使用率 |
{clusterId="",clusterName=""} |
aom_node_virtual_memory_usage{nodeIP="192.168.10.4",clusterId="af3cc895-bc5b-11ec-a642-0255ac101a0b",nameSpace="default"} |
集群可用虚拟内存 |
{clusterId="",clusterName=""} |
aom_cluster_virtual_memory_free_megabytes{clusterId="4ba8008c-b93c-11ec-894a-0255ac101afc",clusterName="servicestage-test"} |
工作负载文件系统使用率 |
{appName="",serviceID="",clusterId="",nameSpace=""} |
aom_container_filesystem_usage{appName="icagent",serviceID="cfebc2222b1ce1e29ad827628325400e",clusterId="af3cc895-bc5b-11ec-a642-0255ac101a0b",nameSpace="kube-system"} |
POD内核占用 |
{podID="",podName=""} |
aom_container_cpu_used_core{podID="573663db-4f09-4f30-a432-7f11bdb8fb2e",podName="icagent-bkm6q"} |
容器上行Bps |
{containerID="",containerName=""} |
aom_container_network_transmit_bytes{containerID="16bf66e9b62c08493ef58ff2b7056aae5d41496d5a2e4bac908c268518eb2cbc",containerName="coredns"} |