更新时间:2023-04-03 GMT+08:00
分享

应用场景

APM应用广泛,下面介绍APM的三个典型应用场景,以便您深入了解。

应用异常诊断

业务痛点

分布式微服务架构下复杂的应用丰富多样、开发效率高,但是给传统运维诊断技术带来了巨大挑战。以电商为例,主要遇到如下问题:

  • 定位问题难

    客服人员接到用户反馈商品购买出现问题后,会交由技术人员排查解决。而微服务分布式架构中的一个业务请求通常要经过多个服务/节点后返回结果。一旦请求出现错误,往往要在多台机器上反复翻看日志才能初步定位问题,对简单问题的排查也常常涉及多个团队。

  • 架构梳理难

    在业务逻辑变得逐渐复杂以后,很难从代码层面去梳理某个应用依赖了哪些下游服务(数据库、HTTP API、缓存),以及被哪些外部调用所依赖。业务逻辑的梳理、架构的治理和容量的规划(例如促销活动的准备过程中,需要为每个应用准备多少台机器)也变得更加困难。

业务实现

APM提供大型分布式应用异常诊断能力,当应用出现崩溃或请求失败时,通过应用拓扑+调用链下钻能力分钟级完成问题定位。

  • 可视化拓扑:应用拓扑自发现,异常应用实例无处躲藏。

  • 调用链追踪:拓扑图中发现异常应用后,通过调用链一键下钻,代码问题根因清晰可见。

  • 慢SQL分析:提供数据库、SQL语句的调用次数、响应时间、错误次数等关键指标视图,支持异常SQL语句导致的数据库性能问题分析。

应用体验管理

业务痛点

在用户体验至上的互联网时代,即使后台业务稳定运行,仍然无法获悉用户访问系统时的具体情况,因而定位线上用户偶现的前端问题变得非常困难。一个系统上线之后,访问时的大量报错导致用户无法正常使用,如果我们无法及时获知,就会导致流失大量用户,如果用户反馈页面的使用情况,我们能否第一时间复现用户的使用场景;能否知晓用户遇到的详细报错信息而快速修复。

业务实现

APM提供应用体验管理能力,实时分析应用事务从用户请求、服务器到数据库,再到服务器、用户请求的完整过程,采用Apdex(应用性能指数)自动化打分,实时感知用户对应用的满意度,帮助您全面了解用户体验状况。对于用户体验差的事务,通过拓扑和调用链完成事务问题定位。

  • 应用KPI分析:吞吐量、时延、成功率指标分析,实时掌控用户体验健康状态,用户体验一览无遗。
  • 全链路性能追踪:Web服务、缓存、数据库全栈跟踪,性能瓶颈轻松掌握。

故障智能诊断

业务痛点

海量业务下,出现百种指标监控、KPI数据、调用跟踪数据等丰富但无关联的应用运维数据,如何通过应用、服务、实例、主机和事务等多视角分析关联指标和告警数据,自动完成故障根因分析;如何基于历史数据学习与运维经验库,对异常事务智能分析给出可能原因。

业务实现

APM提供故障智能诊断能力,基于机器学习算法自动检测应用故障。当事务出现异常时,通过智能算法学习历史指标数据,多维度关联分析异常指标,提取业务正常与异常时上下文数据特征,如资源、参数、调用结构,通过聚类分析找到问题根因。APM可以统计历史上体验好和差的数据并进行比对,同时记录可能导致应用出错的环境数据,包括出入参、调用链、资源数据、JVM参数等,基于EI(企业智能)引擎,对历史数据在线训练与警告预测。

相关文档