设置组件监控开关
自定义设置
自定义设置支持的配置项包括:关联日志服务、Profiler性能剖析配置、组件与基础设施关联分析配置、全采样设置。
- 登录AOM 2.0控制台。
- 在左侧导航栏选择“应用性能监控 > 应用监控 > 组件列表”,进入组件列表页面。
- 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
您还可以在搜索框中通过“应用”、“组件”或“技术栈”筛选出需要查看的组件。
- 单击“组件”列中某一个组件名称,进入该组件详情页。
- 单击“组件设置”页签,进入“自定义设置”页面,可执行如下配置:
图1 自定义设置
- 关联日志服务:
应用性能管理(APM)与云日志服务(LTS)关联,您可以在LTS中关联调用链的TraceID信息,当应用出现故障时,可通过调用链的TraceID快速关联到业务日志,及时定位分析并解决问题。
- 在“自定义设置”页面下的“关联日志服务”配置区域中开启或关闭“关联业务日志与TraceId开关”开关。
- 开启“关联业务日志与TraceId开关”,业务日志中会自动生成调用链的TraceId。
- 关闭“关联业务日志与TraceId开关”,下方关联日志服务设置项不生效。
- 关联的业务日志仅支持Log4j/Log4j2/Logback日志组件。
- 只支持对JAVA类型组件关联日志服务。
- 在“关联日志服务”配置区域中参考下表填写关联日志服务的信息。
图2 关联日志服务设置
- 配置完成后,单击“保存”。
- 在“自定义设置”页面下的“关联日志服务”配置区域中开启或关闭“关联业务日志与TraceId开关”开关。
- Profiler性能剖析配置
- 在“自定义设置”页面下的“Profiler性能剖析配置”配置区域中参考下表填写相关信息。
- 只支持对JAVA类型组件配置Profiler性能剖析。
- 如需接入Profiler性能分析功能,请选择安装该功能支持版本的Agent。
图3 Profiler性能剖析配置表2 Profiler性能剖析配置说明 参数
说明
Profiler启停
开启或关闭“Profiler启停”开关:
- 开启:进行应用Profiler分析,将低开销的应用进行持续诊断,解决Java程序中因为CPU、内存和时延导致的瓶颈问题。
- 关闭:不进行应用Profiler分析。开关默认为关闭状态,即开关置灰
。
当总开关“Profiler启停”关闭时,所有下方所有子开关都处于关闭状态。
CPU
开启或关闭“CPU”开关:
- 开启:采集应用运行过程中CPU火焰图信息。
- 关闭:不采集应用运行过程中CPU火焰图信息。开关默认为关闭,即开关置灰
。
内存
开启或关闭“内存”开关:
- 开启:采集应用运行过程中堆内存火焰图信息。
- Live Object Memory:已分配但未被回收的堆内存,使用场景主要包括内存泄漏等。该功能需要JDK版本为JDK17。
- Allocated Memory:已分配的堆内存(包括已被回收和未被回收的部分),使用场景包括频繁GC(Garbage Collection)等。
- 关闭:不采集应用运行过程中堆内存火焰图信息。开关默认为关闭,即开关置灰
。
时延
开启或关闭“时延”开关:
- 开启:采集应用运行过程中时延火焰图信息。
- 关闭:不采集应用运行过程中时延火焰图信息。开关默认为关闭,即开关置灰
。
生效范围
设置生效范围:
- 组件:组件级范围生效。该组件下关联的所有实例生成Profiler。生效范围默认为“组件”。
- 实例:实例级范围生效。仅对所选实例生成Profiler,实例开启或离线后,不会对新的实例生成Profiler。如果选择了实例级范围生效,则不能将配置信息复制到其他组件和环境。
当生效范围设置为“实例”,需选择实例:
- 单击“实例”按钮下方的“选择实例”。
图4 选择实例
- 选择1个或多个实例,单击“确定”。
图5 选择实例
- 单击“实例”按钮下方的“选择实例”。
- 配置完成后,单击“保存”。
- 在“自定义设置”页面下的“Profiler性能剖析配置”配置区域中参考下表填写相关信息。
- 组件与基础设施关联分析配置
- 在“自定义设置”页面下的“组件与基础设施关联分析设置”配置区域中选择场景,并选择需要存储的普罗实例。
组件与Prometheus实例建立关联之后,在组件实例中可以对容器资源或虚机资源进行观测。图6 组件与基础设施关联分析设置
- 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。
如果需要关联分析,需要先在AOM中创建Prometheus for CCE实例,并在Prometheus实例中一键接入容器监控。
- 针对虚机场景:虚机、虚机上的自建中间件等资源指标存储在Prometheus for ECS类型的实例中。
如果需要关联分析,需要先在AOM中创建Prometheus for ECS实例,并在AOM的接入中心安装Node Exporter或自建中间件Exporter。
- 针对容器场景:容器资源、容器中间件等指标存储在Prometheus for CCE类型的实例中。
- 配置完成后,单击“保存”。
- 在“自定义设置”页面下的“组件与基础设施关联分析设置”配置区域中选择场景,并选择需要存储的普罗实例。
- 全采样设置
- 为了减少调用链数据频繁上报给服务造成的性能影响,APM探针侧发送的调用链数据,默认情况下以最大100TPS的速率上报。在服务并发量超过100TPS的情况下,调用链不会全部上报,如有需要可以通过修改配置文件的方式修改上报阈值,但请做好性能开销的评估。
- 全采样功能在设置100%采样率后,在500TPS、1000TPS、2000TPS的情况下,CPU的消耗相对于智能采样分别增加约5%、10%、20%。
- 只支持对JAVA类型组件进行全采样设置。
- 在“自定义设置”页面下的“全采样设置”配置区域选择采样策略。
图7 全采样设置
- 智能采样:采用智能算法采样,采样策略请参考智能采样算法.。
- 全局采样:针对所有调用链设置全局采样率。默认值(%):100。取值范围(%):0~100。
- 自定义采样:参考下表按照用户的需求,自定义采样率。
表3 自定义采样说明 采样率名称
默认值(%)
取值范围(%)
说明
成功请求采样率
100
0~100
设置成功请求采样率。成功请求是指请求状态码为非错误返回,且无异常的请求。
URL采样率
-
-
URL采样率仅针对成功请求生效。单击“新增”配置如下URL采样率参数:
- URL:URL路径。例如:/apm2/health/v1/health-check。
- 采样率:默认值(%):100。取值范围(%):0~100。
可单击“删除”,删除配置的URL采样率信息。
URL是指“URL监控”监控项中“URL配置”配置项自定义了响应时间阈值的URL。相关配置说明参见配置URL监控项。
错误请求采样率
100
0~100
设置错误请求采样率。
错误请求是指“URL监控”监控项中“错误状态码定义”配置项定义的错误请求。相关配置说明参见配置URL监控项。
慢请求采样率
100
0~100
设置慢请求采样率。
慢请求是指“URL监控”监控项中“慢请求阈值定义”配置项定义的全局请求响应时间小于阈值的请求。相关配置说明参见配置URL监控项。
- 单击“保存”,即可完成配置。全采样设置完成约10分钟后,该配置生效。
- 关联日志服务:
- 以上配置完成,并保存后,可单击各自配置区域的“复用到其他组件”分别将配置信息复用到其他组件;也可单击页面右下角的“批量复制到其他组件”,批量将整个组件设置中的配置信息复用到其他组件。
配置Agent
- 登录AOM 2.0控制台。
- 在左侧导航栏选择“应用性能监控 > 应用监控 > 组件列表”,进入组件列表页面。
- 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
您还可以在搜索框中通过“应用”、“组件”或“技术栈”筛选出需要查看的组件。
- 单击“组件”列中某一个组件名称,进入该组件详情页。
- 单击“组件设置”页签,进入“Agent设置”页面,可以在列表中查看主机的相关信息,还可以对Agent进行启停等操作,详情请参见探针管理。
配置监控项
- 登录AOM 2.0控制台。
- 在左侧导航栏选择“应用性能监控 > 应用监控 > 组件列表”,进入组件列表页面。
- 在左侧“快速筛选”栏中,选择“区域”、“应用”以及“技术栈”,即可在组件列表中快速筛选出需要的组件。
您还可以在搜索框中通过“应用”、“组件”或“技术栈”筛选出需要查看的组件。
- 单击“组件”列中某一个组件名称,进入该组件详情页。
- 单击“组件设置”页签,进入“监控项”页面,即可在列表中查看监控项、监控项名称、采集间隔等信息,并可根据需要执行以下操作:
表4 “监控项”相关操作 操作
说明
启停监控项
单击“监控项启停”列的开关按钮,即可启停监控项。“监控项启停”按钮
默认开启。
编辑监控项
单击“操作”列的“编辑”,即可修改采集器的监控项配置信息。相关配置说明参见配置监控项
刷新监控项
单击监控项列表右上角
,可实时获取所有监控项的最新信息。