- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 通过IAM授予使用AOM的权限
- 接入AOM
- 接入AOM(新版)
- 可观测指标浏览
- 仪表盘监控
- 告警监控
- 日志管理(新版)
- 日志管理(旧版)
-
Prometheus监控
- Prometheus监控概述
- 管理Prometheus实例
- 管理Prometheus实例指标数据
- 使用Prometheus监控CCE集群指标
- 配置多账号聚合实现指标统一监控
- 配置CCE集群监控采集指标规则
- 配置预聚合规则提升指标查询效率
- 配置数据多写实现监控指标转储到自建Prometheus
- 配置指标存储时长
- 通过仪表盘监控Prometheus实例指标数据
- 配置Remote Read地址实现自建Prometheus读取AOM的Prometheus数据
- 配置Remote Write地址实现自建Prometheus数据上报到AOM
- 通过Grafana查看Prometheus实例数据
- 查看Prometheus实例指标上报量
- 基础设施监控
- 云服务监控
- 应用监控
- 智能洞察(BETA)
- Web监控
- App监控
- 应用洞察
- 运维管理
- 全局设置
- 查看AOM审计事件
- 迁移AOM 1.0数据至AOM 2.0
- 最佳实践
-
常见问题
- 仪表盘
- 告警管理
- 日志分析
- Prometheus监控
- 基础设施监控
- 应用监控
-
采集管理
- ICAgent和UniAgent是同一个插件吗?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 在主机上手工安装ICAgent后提示安装成功,但UniAgent安装与配置界面显示状态异常?
- ICAgent安装成功后,无法在界面上获取到ICAgent状态
- ICAgent安装成功后,AOM中无法监控到CPU内存使用率等信息
- 如何获取AK/SK?
- UniAgent和ICAgent安装类常见问题
- 如何在VPCEP控制台为AOM/LTS创建终端节点?
- 如何启用NGINX stub_status模块?
- APM指标数据未采集上来,可能有哪些原因?
- ECS主机上执行UniAgent安装命令,下载安装脚本失败
- 应用资源管理(即将下线)
- 运维管理(即将下线)
- 其他常见问题
- 视频帮助
- API参考
- SDK参考
- 场景代码示例
-
AOM 1.0 文档
- 产品介绍(1.0)
- 快速入门(1.0)
- 用户指南(1.0)
- 最佳实践(1.0)
-
常见问题(1.0)
- 用户高频问题
- 常见咨询问题
-
常见使用问题
- 没有消息通知服务的访问权限?
- 资源运行异常怎么办?
- 如何设置全屏模式在线时长?
- 日志配额已达到90%或已满怎么办?
- 如何获取AK/SK?
- 如何查询服务不可用时间?
- AOM告警规则状态为什么显示“数据不足”?
- 正常状态的工作负载,AOM界面显示异常是什么原因?
- 如何创建委托apm_admin_trust?
- 如何通过创建委托获取AK/SK?
- 日志费用说明
- 在控制台查看不到日志怎么办?
- 如何处理界面“ICAgent状态”为“离线”的问题?
- 安装了ICAgent,但是监控不到主机是什么原因?
- 安装ICAgent过程中,系统提示“no crontab for root”是什么原因?
- AOM配置日志转储时无法选中obs桶是什么原因?
- Grafana无法展示内容是什么原因?
- 视频帮助(1.0)
- 文档下载
- 通用参考
链接复制成功!
设置组件监控开关
自定义设置
自定义设置支持的配置项包括:关联日志服务、Profiler性能剖析配置、组件与基础设施关联分析配置、全采样设置。
- 登录AOM 2.0控制台。
- 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
- 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
您还可以在搜索框中通过“应用”、“组件”或“技术栈”筛选出需要查看的组件。
- 单击“组件”列中某一个组件名称,进入该组件详情页。
- 单击“组件设置”页签,进入“自定义设置”页面,可执行如下配置:
图1 自定义设置
- 关联日志服务:
应用性能管理(APM)与云日志服务(LTS)关联,您可以在 LTS中关联调用链的 TraceID 信息,当应用出现故障时,可通过调用链的 TraceID 快速关联到业务日志,及时定位分析并解决问题。
- 在“自定义设置”页面下的“关联日志服务”配置区域中开启或关闭“关联业务日志与TraceId开关”开关。
- 开启“关联业务日志与TraceId开关”,业务日志中会自动生成调用链的TraceId。
- 关闭“关联业务日志与TraceId开关”,下方关联日志服务设置项不生效。
- 关联的业务日志仅支持Log4j/Log4j2/Logback日志组件。
- 只支持对JAVA类型组件关联日志服务。
- 在“关联日志服务”配置区域中参考下表填写关联日志服务的信息。
图2 关联日志服务设置
- 配置完成后,单击“保存”。
- 在“自定义设置”页面下的“关联日志服务”配置区域中开启或关闭“关联业务日志与TraceId开关”开关。
- Profiler性能剖析配置
- 在“自定义设置”页面下的“Profiler性能剖析配置”配置区域中参考下表填写相关信息。
- 只支持对JAVA类型组件配置Profiler性能剖析。
- 如需接入Profiler性能分析功能,请选择安装该功能支持版本的Agent。
图3 Profiler性能剖析配置表2 Profiler性能剖析配置说明 参数
说明
Profiler启停
开启或关闭“Profiler启停”开关:
- 开启:进行应用Profiler分析,将低开销的应用进行持续诊断,解决Java程序中因为CPU、内存和时延导致的瓶颈问题。
- 关闭:不进行应用Profiler分析。开关默认为关闭状态,即开关置灰
。
当总开关“Profiler启停”关闭时,所有下方所有子开关都处于关闭状态。
CPU
开启或关闭“CPU”开关:
- 开启:采集应用运行过程中CPU火焰图信息。
- 关闭:不采集应用运行过程中CPU火焰图信息。开关默认为关闭,即开关置灰
。
内存
开启或关闭“内存”开关:
- 开启:采集应用运行过程中堆内存火焰图信息。
- Live Object Memory:已分配但未被回收的堆内存,使用场景主要包括内存泄漏等。该功能需要JDK版本为JDK17。
- Allocated Memory:已分配的堆内存(包括已被回收和未被回收的部分),使用场景包括频繁GC(Garbage Collection)等。
- 关闭:不采集应用运行过程中堆内存火焰图信息。开关默认为关闭,即开关置灰
。
时延
开启或关闭“时延”开关:
- 开启:采集应用运行过程中时延火焰图信息。
- 关闭:不采集应用运行过程中时延火焰图信息。开关默认为关闭,即开关置灰
。
生效范围
设置生效范围:
- 组件:组件级范围生效。该组件下关联的所有实例生成Profiler。生效范围默认为“组件”。
- 实例:实例级范围生效。仅对所选实例生成Profiler,实例开启或离线后,不会对新的实例生成Profiler。如果选择了实例级范围生效,则不能将配置信息复制到其他组件和环境。
当生效范围设置为“实例”,需选择实例:
- 单击“实例”按钮下方的“选择实例”。
图4 选择实例
- 选择1个或多个实例,单击“确定”。
图5 选择实例
- 单击“实例”按钮下方的“选择实例”。
- 配置完成后,单击“保存”。
- 在“自定义设置”页面下的“Profiler性能剖析配置”配置区域中参考下表填写相关信息。
- 组件与基础设施关联分析配置
- 在“自定义设置”页面下的“组件与基础设施关联分析设置”配置区域中选择场景,并选择需要存储的普罗实例。
组件与Prometheus实例建立关联之后,在组件实例中可以对容器资源或虚机资源进行观测。图6 组件与基础设施关联分析设置
- 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。
如果需要关联分析,需要先在AOM中创建Prometheus for CCE实例,并在Prometheus实例中一键接入容器监控。
- 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus for ECS类型的实例中。
如果需要关联分析,需要先在AOM中创建Prometheus for ECS实例,并在AOM的接入中心安装Node Exporter或自建中间件Exporter。
- 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。
- 配置完成后,单击“保存”。
- 在“自定义设置”页面下的“组件与基础设施关联分析设置”配置区域中选择场景,并选择需要存储的普罗实例。
- 全采样设置
- 为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,调用链不会全部上报,如有需要可以通过修改配置文件的方式修改上报阈值,但请做好性能开销的评估。
- 全采样功能在设置100%采样率后,在500TPS、1000TPS、2000TPS的情况下,CPU的消耗相对于智能采样分别增加约5%、10%、20%。
- 只支持对JAVA类型组件进行全采样设置。
- 在“自定义设置”页面下的“全采样设置”配置区域选择采样策略。
图7 全采样设置
- 智能采样:采用智能算法采样,采样策略请参考智能采样算法.。
- 全局采样:针对所有调用链设置全局采样率。默认值(%):100。取值范围(%):0~100。
- 自定义采样:参考下表按照用户的需求,自定义采样率。
表3 自定义采样说明 采样率名称
默认值(%)
取值范围(%)
说明
成功请求采样率
100
0~100
设置成功请求采样率。成功请求是指请求状态码为非错误返回,且无异常的请求。
URL采样率
-
-
URL采样率仅针对成功请求生效。单击“新增”配置如下URL采样率参数:
- URL:URL路径。例如:/apm2/health/v1/health-check。
- 采样率:默认值(%):100。取值范围(%):0~100。
可单击“删除”,删除配置的URL采样率信息。
URL是指“URL监控”监控项中“URL配置”配置项自定义了响应时间阈值的URL。相关配置说明参见配置URL监控项。
错误请求采样率
100
0~100
设置错误请求采样率。
错误请求是指“URL监控”监控项中“错误状态码定义”配置项定义的错误请求。相关配置说明参见配置URL监控项。
慢请求采样率
100
0~100
设置慢请求采样率。
慢请求是指“URL监控”监控项中“慢请求阈值定义”配置项定义的全局请求响应时间小于阈值的请求。相关配置说明参见配置URL监控项。
- 单击“保存”,即可完成配置。全采样设置完成约10分钟后,该配置生效。
- 关联日志服务:
- 以上配置完成,并保存后,可单击各自配置区域的“复用到其他组件”分别将配置信息复用到其他组件;也可单击页面右下角的“批量复制到其他组件”,批量将整个组件设置中的配置信息复用到其他组件。
配置Agent
- 登录AOM 2.0控制台。
- 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
- 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
您还可以在搜索框中通过“应用”、“组件”或“技术栈”筛选出需要查看的组件。
- 单击“组件”列中某一个组件名称,进入该组件详情页。
- 单击“组件设置”页签,进入“Agent设置”页面,可以在列表中查看主机的相关信息,还可以对Agent进行启停等操作,详情请参见探针管理。
配置监控项
- 登录AOM 2.0控制台。
- 在左侧导航栏选择“应用监控 > 组件列表”,进入组件列表页面。
- 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
您还可以在搜索框中通过“应用”、“组件”或“技术栈”筛选出需要查看的组件。
- 单击“组件”列中某一个组件名称,进入该组件详情页。
- 单击“组件设置”页签,进入“监控项”页面,即可在列表中查看监控项、监控项名称、采集间隔等信息,并可根据需要执行以下操作:
表4 “监控项”相关操作 操作
说明
启停监控项
单击“监控项启停”列的开关按钮,即可启停监控项。“监控项启停”按钮
默认开启。
编辑监控项
单击“操作”列的“编辑”,即可修改采集器的监控项配置信息。相关配置说明参见配置监控项
刷新监控项
单击监控项列表右上角
,可实时获取所有监控项的最新信息。