文档首页/ 应用运维管理 AOM/ 用户指南/ 智能巡检/ 通过AOM查看事件根因分析结果
更新时间:2026-04-16 GMT+08:00
分享

通过AOM查看事件根因分析结果

智能巡检提供异常事件快速根因定位分析的功能。根因分析基于事件巡检看护的服务历史数据,根据服务指标、调用链数据进行下钻分析,细粒度定位事件根因。

查看事件根因分析结果

  1. 登录AOM 2.0控制台
  2. 左侧导航栏单击应用性能监控 > 智能洞察 > 智能巡检,进入智能巡检页面。
  3. 单击事件卡片或列表中事件类型名称进入该事件详情页面,查看各类型事件的根因分析。(单击事件详情页的根因分析中的根因组件名称可以跳转至对应组件的详情页面。当前仅新加坡区域支持跳转。)

    • 应用服务整体平均响应时间突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的平均时延以快速定位根因,找到导致应用整体RT突增的具体组件。
      图1 应用服务整体平均响应时间突增
    • 应用服务整体错误率突增:基于应用的调用链数据,针对应用粒度提供下钻分析,分析应用下每个组件的错误率以快速定位根因,下钻到应用下具体组件的错误率异常。单击“查看调用链”,可详细追踪错误率突增的原因。
      图2 应用服务整体错误率突增
    • TopN接口平均响应时间突增:基于应用的调用链数据,针对接口粒度提供调用链响应时间分析,快速定位根因。
      图3 TopN接口平均响应时间突增
    • TopN接口错误率突增:基于应用的调用链数据,针对接口粒度提供调用链错误率分析,快速定位根因。单击“查看调用链”,可详细追踪错误率突增的原因。
      图4 TopN接口错误率突增

事件根因分析方法说明

“智能巡检”根因分析方法是一种基于调用链下钻的根因分析方法,分为离线训练和在线推理两个阶段:
  1. 离线训练阶段:在用户开通“智能巡检”功能后,后台会自动开启基于调用链的根因分析模型的离线训练任务,并自动获取应用接口发生调用时产生的调用链数据,然后根据应用近7天的调用链数据来训练调用链模型。默认每14天后台自动更新模型,并将模型保存在后台数据库中。

  2. 在线推理阶段:当用户单击事件卡片,进入到根因分析页面时,会触发根因分析模型的在线推理任务,在线推理任务会基于上一步离线训练完的调用链模型与事件发生期间的异常调用进行模式对比,分析事件根因,进行快速定位。

相关文档