更新时间:2025-08-20 GMT+08:00
分享

应用诊断

操作场景

当事件创建后,您可以通过应用诊断(全链路诊断)功能快速定位故障根因。用户通过应用诊断可以查看应用层、组件层、资源层的关系拓扑,基于资源和应用告警的异常数据,并提供资源核心指标查看与实例诊断能力。

前提条件

  • 确保已接入CES监控,请到集成管理进行配置。
  • 已创建事件单。
  • 如果需要展示CCE集群中的负载,pod信息,需要在CCE中对负载进行标签配置(每个分组只能添加一个CCE集群资源,否则不展示负载等信息)。
    图1 配置CCE负载标签

应用诊断

  1. 登录云运维中心
  2. 在左侧导航栏选择“故障管理 > 事件管理”。
  3. 单击上方“全部事件单”。
  4. 选择需要诊断的事件单,单击事件标题。
  5. 单击上方“应用诊断”。
  6. 单击时间框,设置故障时间。

    时间框输入的时间为“结束时间”,“起始时间”为“结束时间”向前1小时。选择时间后,应用拓扑大屏展示所选时间段内应用和子应用的告警数量,右侧详情页展示应用故障详情。

  7. (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。

    勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。

  8. (可选)若应用有子应用,单击子应用。

    应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。

  9. 单击应用或子应用下组件。

    应用拓扑大屏展示该组件下的所有资源,右侧详情页展示组件故障详情。支持在拓扑大屏切换查看其它组件。支持核心云服务的指标展示,如果在应用管理中有关联APM,也可以查看链路相关指标。

  10. 单击应用拓扑右侧“告警”。

    查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。

  11. 单击应用拓扑右侧“变更”。

    查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。

  12. 单击应用拓扑右侧“故障诊断”。

    查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS、ECS、ELB资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。

    未创建过诊断或创建新诊断,具体操作如下。

    1. 单击“创建诊断”。
    2. 选择资源类型和资源。
    3. 单击“确定”。
    4. 确认“《GuestOS诊断服务前端数据授权》”,单击“同意”。

      只有故障诊断选择ECS时需要签署同意许可。

    诊断完成后,单击诊断结果列表右侧“查看详情”,查看诊断报告。

相关文档