通过APM配置Java应用告警
应用性能管理APM是一种用于实时监控和管理云端应用性能与故障的云服务,能帮助运维人员快速发现应用的性能瓶颈,以及故障根源的快速定位,为用户体验保驾护航。对于部署在Standard/Turbo集群中的Java类工作负载,您只需安装APM探针,无需修改代码,即可实现应用的全方位监控,快速定位出错与慢接口,重现调用参数,识别系统瓶颈,大幅提升线上问题诊断效率。
同时,您可以通过APM配置应用告警,在第一时间获取到服务的异常状况,进而迅速处理故障,避免造成业务损失。APM为用户提供多个基础告警模板推荐,比如通过GC(垃圾回收)监控告警提前感知JVM内存压力。
设置性能管理配置
- 登录CCE控制台,单击集群名称进入集群。
- 在左侧导航栏中选择“工作负载”,在右上角单击“创建工作负载”。
- 在“高级配置”的“性能管理配置”页签中,安装探针,建议使用APM2.0探针。
- 设置探针参数,详情请参见设置性能管理配置。
表1 APM2.0探针参数说明 参数
示例
说明
探针版本
2.5.2
表示探针的版本,请结合以下信息按需选择版本:
- 探针版本latest并不映射最新版本,探针版本能力请参见JavaAgent更新说明。
- 探针支持多种CPU架构(如x86、ARM架构),请根据负载所在节点的架构进行选择对应版本。若探针的版本号无“x86_64”或“aarch64”字样,则表示系统将自动匹配节点架构。
探针升级策略
重启自动升级
表示探针升级的方式,默认为“重启自动升级”。
- 重启自动升级:当工作负载重启时,始终重新下载探针镜像。
- 重启手动升级:当工作负载重启时,如果本地有探针镜像,则使用本地镜像,否则重新下载镜像。
APM环境
/
非必填,请输入环境名称,APM服务将自动为该负载创建对应环境。通过设置APM环境, 可以区分不同部署阶段(如生产和测试)的性能数据,实现应用性能的分类管理与精准分析。
APM应用
default
请选择APM服务中已有的应用。通过应用,可将监控数据按功能模块分类,便于统一管理和分析。
子应用
/
非必填,请输入APM服务子应用名称,在应用基础上实现更精细化管理。
若APM服务中已存在该子应用,负载将自动归属其中;否则系统将自动创建对应的子应用。
接入密钥
AK:xxx
SK:xxx
表示APM服务的密钥信息,用于获取上报数据的权限,CCE将会自动获取APM服务的密钥信息。
- 填写其他参数后,单击“创建工作负载”。工作负载状态变为“运行中”后,请等待大约3分钟,应用数据将呈现在APM界面。
通过APM配置应用GC监控告警
您可以在APM根据GC监控告警模板创建告警策略,并将告警策略应用至CCE集群中,详情请参见推荐模板。
- 登录应用性能管理控制台。
- 在左侧导航栏中选择“应用监控 > 指标”,在界面左侧树单击对应的应用,进入该应用的指标详情页。
- 切换至“告警模板配置”页签,单击“推荐模板”,查看已配置好的告警模板。
- 单击gc监控模板的“复制”,将推荐模板复制到模板列表,复制时可自定义模板名称。
- 单击“确定”后返回告警模板配置页面,此时页面会默认搜索刚复制的告警模板。
- 单击“操作”列的“编辑”,绑定节点后复制的模板才能生效。本示例中选择绑定全部节点,该APM应用中后续新增的节点将会自动进行绑定,即CCE中新增的工作负载选择对接该APM应用会自动加入告警。
此处的“节点”是APM服务的概念,是指应用目录树中的节点,而不是Kubernetes集群中定义的节点(Node)概念。