更新时间:2024-07-31 GMT+08:00
分享

故障传播链分析

故障传播链图谱基于服务的调用链和平均RT、错误率等分析关键指标数据,找出异常调用在调用链追踪链路trace中的传播关系,并展示服务及其关联服务的关键指标数据,可以更有效地定位根因。

功能入口

  1. 登录AOM 2.0控制台。
  2. 在菜单栏选择“监控中心”,进入“监控中心”界面。
  3. 左侧导航栏单击“智能洞察(BETA)”。
  4. 在页面右上角设置应用的时间范围。可通过如下两种方式设置时间范围:

    方式一:使用AOM预定义好的时间标签,例如,近1小时、近6小时等,您可根据实际需要选择不同的时间粒度。

    方式二:通过开始时间和结束时间,自定义时间范围。

  5. 在过滤器上方的下拉列表中选择需要查看的应用。
  6. 单击事件卡片或列表进入该事件详情页面,查看事件的故障传播链。

    支持查看故障传播链的异常事件类型包括:
    • 应用服务整体平均响应时间突增
    • TopN接口平均响应时间突增
    • 应用服务整体错误率突增
    • TopN接口错误率突增

通过故障转播图谱定位根因

在事件详情页面,故障传播链将展示调用链中的故障传播图谱。

图1 故障传播图谱

相关文档