什么是应用性能管理服务
应用运维遇到挑战
在云时代微服务架构下应用日益丰富,纷杂的应用异常问题接踵而来。应用运维面临巨大挑战:
- 分布式应用关系错综复杂,应用性能问题分析定位困难,应用运维面临如何保障应用正常、快速完成问题定位、迅速找到性能瓶颈的挑战。
- 应用体验差导致用户流失。运维人员如果无法实时感知并追踪体验差的业务,不能及时诊断应用异常,将严重影响用户体验。
- 业务系统的应用多、分布广,跨系统、跨区域、跨应用的调用频繁,如何降低应用的管理和运维成本,提升应用运维的效率是迫切需要解决的问题。
APM帮您解决
华为云应用性能管理服务(Application Performance Management,简称APM)帮助运维人员快速发现应用的性能瓶颈,以及故障根源的快速定位,为用户体验保驾护航。
您无需修改代码,只需为应用安装一个APM Agent,就能够对该应用进行全方位监控,帮助您快速定位出错接口和慢接口、重现调用参数、发现系统瓶颈,从而大幅提升线上问题诊断的效率。目前支持JAVA应用,具体的应用监控能力概览如下表。
场景能力 |
说明 |
---|---|
非侵入的应用性能数据采集 |
用户无需更改应用代码,只需要部署APM Agent包,修改相应的应用启动参数,就可以实现应用监控。 |
应用指标监控 |
无须配置,自动监控应用相关大量监控指标,如JVM、JavaMethod、URL、Exception、Tomcat、httpClient、Mysql、Redis、kafka等。 |
应用拓扑 |
通过对RPC调用信息进行动态分析、智能计算,自动生成分布式应用间拓扑关系。 |
调用链追踪 |
多个应用接入APM后,自动针对某一些请求进行采样,采集单个请求的服务之间调用关系以及中间调用的健康情况,实现全局调用链路的自动跟踪。 |
常用诊断场景的指标下钻分析 |
根据应用响应时间、请求数、错误率等指标下钻分析,按应用、组件、环境、数据库和中间件等多维度查看。 |
异常URL跟踪和慢URL跟踪捕捉 |
基于调用URL跟踪的超时和异常分析,并有效自动关联到对应的接口调用,如 SQL、MQ 等。 |
- 接入APM:应用通过APM自身的AK/SK鉴权进行接入。
- 数据采集:APM可以通过非侵入方式采集APM Agent提供的应用数据、基础资源数据、用户体验数据等多项指标。
- 业务实现:APM支持应用指标监控、应用拓扑、调用链追踪和智能告警功能。
- 业务拓展:
- 通过APM的应用拓扑、调用链追踪等快速诊断应用性能异常,并结合AOM(应用运维管理)的应用运维指标进行综合判断。
- 找到应用性能瓶颈后,可以通过CodeArts PerfTest(性能测试 )关联分析生成性能报表。
- 通过智能算法学习历史指标数据,APM多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,通过聚类分析找到问题根因。
产品优势
非侵入式性能数据采集,无需修改业务代码即可轻松接入APM,数据来源如下:
- APM Agent:基于自研Agent通过非侵入方式采集业务调用数据、服务存量数据、调用的KPI数据等应用指标。
支持亿级调用链业务吞吐,无惧流量凶猛,为用户体验保驾护航。
开放了运营、运维数据查询接口和性能指标、采集标准,支持自主开发。
AI智能阈值检测,机器学习历史基线数据产生告警,通过RCA(Root Cause Analysis)分析找到问题根因。