更新时间:2025-09-30 GMT+08:00
分享

通过APM配置Java应用告警

应用性能管理APM是一种用于实时监控和管理云端应用性能与故障的云服务,能帮助运维人员快速发现应用的性能瓶颈,以及故障根源的快速定位,为用户体验保驾护航。对于部署在Standard/Turbo集群中的Java类工作负载,您只需安装APM探针,无需修改代码,即可实现应用的全方位监控,快速定位出错与慢接口,重现调用参数,识别系统瓶颈,大幅提升线上问题诊断效率。

同时,您可以通过APM配置应用告警,在第一时间获取到服务的异常状况,进而迅速处理故障,避免造成业务损失。APM为用户提供多个基础告警模板推荐,比如通过GC(垃圾回收)监控告警提前感知JVM内存压力。

设置性能管理配置

  1. 登录CCE控制台,单击集群名称进入集群。
  2. 在左侧导航栏中选择“工作负载”,在右上角单击“创建工作负载”
  3. “高级配置”的“性能管理配置”页签中,安装探针,建议使用APM2.0探针。
  4. 设置探针参数,详情请参见设置性能管理配置

    表1 APM2.0探针参数说明

    参数

    示例

    说明

    探针版本

    2.5.2

    表示探针的版本,请结合以下信息按需选择版本:

    • 探针版本latest并不映射最新版本,探针版本能力请参见JavaAgent更新说明
    • 探针支持多种CPU架构(如x86、ARM架构),请根据负载所在节点的架构进行选择对应版本。若探针的版本号无“x86_64”或“aarch64”字样,则表示系统将自动匹配节点架构。

    探针升级策略

    重启自动升级

    表示探针升级的方式,默认为“重启自动升级”。

    • 重启自动升级:当工作负载重启时,始终重新下载探针镜像。
    • 重启手动升级:当工作负载重启时,如果本地有探针镜像,则使用本地镜像,否则重新下载镜像。

    APM环境

    /

    非必填,请输入环境名称,APM服务将自动为该负载创建对应环境。通过设置APM环境, 可以区分不同部署阶段(如生产和测试)的性能数据,实现应用性能的分类管理与精准分析。

    APM应用

    default

    请选择APM服务中已有的应用。通过应用,可将监控数据按功能模块分类,便于统一管理和分析。

    子应用

    /

    非必填,请输入APM服务子应用名称,在应用基础上实现更精细化管理。

    若APM服务中已存在该子应用,负载将自动归属其中;否则系统将自动创建对应的子应用。

    接入密钥

    AK:xxx

    SK:xxx

    表示APM服务的密钥信息,用于获取上报数据的权限,CCE将会自动获取APM服务的密钥信息

  5. 填写其他参数后,单击“创建工作负载”。工作负载状态变为“运行中”后,请等待大约3分钟,应用数据将呈现在APM界面。

通过APM配置应用GC监控告警

您可以在APM根据GC监控告警模板创建告警策略,并将告警策略应用至CCE集群中,详情请参见推荐模板

  1. 登录应用性能管理控制台
  2. 在左侧导航栏中选择“应用监控 > 指标”,在界面左侧树单击对应的应用,进入该应用的指标详情页。
  3. 切换至“告警模板配置”页签,单击“推荐模板”,查看已配置好的告警模板。

  4. 单击gc监控模板的“复制”,将推荐模板复制到模板列表,复制时可自定义模板名称。

  5. 单击“确定”后返回告警模板配置页面,此时页面会默认搜索刚复制的告警模板。
  6. 单击“操作”列的“编辑”,绑定节点后复制的模板才能生效。本示例中选择绑定全部节点,该APM应用中后续新增的节点将会自动进行绑定,即CCE中新增的工作负载选择对接该APM应用会自动加入告警。

    此处的“节点”是APM服务的概念,是指应用目录树中的节点,而不是Kubernetes集群中定义的节点(Node)概念。

查看应用GC监控告警

  1. 登录应用性能管理控制台
  2. 在左侧导航栏中选择“告警中心 > 告警列表”,单击应用下拉框,选择应用,查看该应用下的告警。

    如果您需要配置短信或邮件等告警通知方式,请参见告警通知

相关文档