文档首页/ 应用性能管理 APM/ 产品介绍(2.0)/ 什么是应用性能管理服务
更新时间:2023-08-18 GMT+08:00

什么是应用性能管理服务

应用运维遇到挑战

在云时代微服务架构下应用日益丰富,纷杂的应用异常问题接踵而来。应用运维面临巨大挑战:

  • 分布式应用关系错综复杂,应用性能问题分析定位困难,应用运维面临如何保障应用正常、快速完成问题定位、迅速找到性能瓶颈的挑战。
  • 应用体验差导致用户流失。运维人员如果无法实时感知并追踪体验差的业务,不能及时诊断应用异常,将严重影响用户体验。
  • 业务系统的应用多、分布广,跨系统、跨区域、跨应用的调用频繁,如何降低应用的管理和运维成本,提升应用运维的效率是迫切需要解决的问题。

APM帮您解决

华为云应用性能管理服务(Application Performance Management,简称APM)帮助运维人员快速发现应用的性能瓶颈,以及故障根源的快速定位,为用户体验保驾护航。

您无需修改代码,只需为应用安装一个APM Agent,就能够对该应用进行全方位监控,帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈,从而大幅提升线上问题诊断的效率。目前支持JAVA应用,具体的应用监控能力概览如下表。

表1 APM监控能力

场景能力

说明

非侵入的应用性能数据采集

用户无需更改应用代码,只需要部署APM Agent包,修改相应的应用启动参数,就可以实现应用监控。

应用指标监控

无须配置,自动监控应用相关大量监控指标,如JVM、JavaMethod、URL、Exception、Tomcat、httpClient、Mysql、Redis、kafka等。

应用拓扑

通过对RPC调用信息进行动态分析、智能计算,自动生成分布式应用间拓扑关系。

调用链追踪

多个应用接入APM后,自动针对某一些请求进行采样,采集单个请求的服务之间调用关系以及中间调用的健康情况,实现全局调用链路的自动跟踪。

常用诊断场景的指标下钻分析

根据应用响应时间、请求数、错误率等指标下钻分析,按应用、组件、环境、数据库和中间件等多维度查看。

异常URL跟踪和慢URL跟踪捕捉

基于调用URL跟踪的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。

  1. 接入APM:应用通过APM自身的AK/SK鉴权进行接入。
  2. 数据采集:APM可以通过非侵入方式采集APM Agent提供的应用数据、基础资源数据、用户体验数据等多项指标。
  3. 业务实现:APM支持应用指标监控、应用拓扑、调用链追踪和智能告警功能。
  4. 业务拓展:
    • 通过APM的应用拓扑、调用链追踪等快速诊断应用性能异常,并结合AOM(应用运维管理)的应用运维指标进行综合判断。
    • 找到应用性能瓶颈后,可以通过CodeArts PerfTest(性能测试 )关联分析生成性能报表。
    • 通过智能算法学习历史指标数据,APM多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,通过聚类分析找到问题根因。

产品优势

非侵入式性能数据采集,无需修改业务代码即可轻松接入APM,数据来源如下:

  • APM Agent:基于自研Agent通过非侵入方式采集业务调用数据、服务存量数据、调用的KPI数据等应用指标。

支持亿级调用链业务吞吐,无惧流量凶猛,为用户体验保驾护航。

开放了运营、运维数据查询接口和性能指标、采集标准,支持自主开发。

AI智能阈值检测,机器学习历史基线数据产生告警,通过RCA(Root Cause Analysis)分析找到问题根因。