更新时间:2022-03-24 GMT+08:00
分享

产品概述

应用运维遇到挑战

在云时代,分布式微服务架构下应用日益丰富,用户数量爆发式增长,纷杂的应用异常问题接踵而来。传统运维模式下,多套运维系统上的各项指标无法关联分析, 运维人员需要根据运维经验逐一排查应用异常,分析定位问题效率低,维护成本高且稳定性差。

海量业务下应用运维面临以下两个方面的挑战:

  • 大型分布式应用关系错综复杂,分析定位应用问题困难,应用运维面临如何保障应用正常、快速完成问题定位、迅速找到性能瓶颈的挑战。
  • 应用体验差导致用户流失。运维人员不能实时感知并追踪体验差的业务,未能及时诊断应用异常,严重影响用户体验。

APM帮您解决

华为云应用性能管理服务(Application Performance Management,简称APM)是实时监控并管理云应用性能和故障的云服务,提供专业的分布式应用性能分析能力,可以帮助运维人员快速解决应用在分布式架构下的问题定位和性能瓶颈等难题,为用户体验保驾护航。

APM作为云应用诊断服务,拥有强大的分析工具,通过拓扑图调用链事务分析可视化地展现应用状态、调用过程、用户对应用的各种操作,快速定位问题和改善性能瓶颈。

图1 APM架构图
  1. 访问APM:通过IAM(统一身份认证)的委托、AK/SK鉴权可以访问APM。
  2. 数据采集:APM可以通过非侵入方式采集Java探针、Istio网格等提供的应用数据、基础资源数据、用户体验数据等多项指标。
  3. 业务实现:APM支持全链路拓扑调用链追踪事务分析功能。
  4. 业务拓展:
    • AOM(应用运维管理)实时监控应用运维指标,APM通过拓扑、调用链等快速诊断应用性能异常。
    • 通过APM找到性能瓶颈后,CPTS(云性能测试服务)关联分析生成性能报表。
    • 通过智能算法学习历史指标数据,APM多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,通过聚类分析找到问题根因。

产品优势

非侵入式性能数据采集,无需修改业务代码即可轻松接入APM,数据源包括如下:

  • Java探针:基于业界Pinpoint开源项目通过非侵入方式采集业务调用数据、服务存量数据、调用的KPI数据等应用指标。
  • Istio网格:集成Kubernetes平台通过非侵入方式采集业务调用数据、资源信息、调用的KPI数据等应用指标。

支持亿级调用链业务吞吐,无惧流量凶猛,为用户体验保驾护航。

AI智能阈值检测,机器学习历史基线数据产生告警,通过RCA(Root Cause Analysis)分析找到问题根因。

开放了运营、运维数据查询接口和性能指标、采集标准,支持自主开发。

相关文档