更新时间:2025-07-29 GMT+08:00

影响应用管理

操作场景

在故障发生时,若有应用受影响,用户可以在WarRoom详情中添加影响应用。对于影响应用,可以通过应用诊断检查应用详情,通过执行预案快速恢复应用。

新增影响应用

WarRoom在启动、故障定界和恢复阶段支持新增影响应用功能。

  1. 登录云运维中心
  2. 在左侧导航栏选择“故障管理 > WarRoom”。
  3. 单击需要修改的WarRoom标题。
  4. 单击“新增影响应用”。
  5. 设置“新增影响应用”。

    表1 新增影响应用参数说明

    参数

    说明

    影响应用

    在下拉列表选择受影响应用。

    开始时间

    请填写应用开始受影响的时间。

    默认为创建WarRoom时间,开始时间不得晚于创建WarRoom时间。

    恢复时间

    可选参数。请填写应用恢复时间。

    恢复时间不得早于创建WarRoom时间。

    影响描述

    请填写应用相关的影响描述。

    限制长度最长500个字符。

  6. 单击“确定”。

    完成影响应用新增。单击受影响应用可以查看该应用的告警、事件和变更信息。

执行预案

  1. 登录云运维中心
  2. 在左侧导航栏选择“故障管理 > WarRoom”。
  3. 单击需要修改的WarRoom标题。
  4. 选择需要处理的应用,单击“执行预案”。
  5. 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行”。

    若没有合适的应急预案需要创建,请参考创建应急预案

  6. 根据应急预案关联的任务类型。

    • 若任务类型为脚本,执行步骤7
    • 若任务类型为作业,执行步骤8

  7. 设置“执行脚本”。

    • 脚本入参:脚本入参在录入自定义脚本时已预置好参数名称与参数默认值。
    • 执行用户:默认“root”,目标实例节点上执行脚本的用户。
    • 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。
    • 目标实例:单击“添加实例”,设置“选择实例”。
      表2 选择实例参数说明

      参数

      说明

      示例

      选择方式

      请选择实例选择方式。

      • 手动选择:根据“企业项目”、“视图类型”、“资源类型”、“区域”和“目标实例”确认筛选条件,手动选择实例。

      手动选择

      企业项目

      在下拉列表中选择企业项目,支持选择“全部”。

      全部

      视图类型

      请选择视图类型。

      • CMDB资源视角:以资源视角选择实例列表。
      • CMDB应用视角:以应用视角选择实例列表。

      CMDB资源视角

      资源类型

      可选项“ECS”、“BMS”。

      ECS

      区域

      在下拉列表中选择区域。

      中国-香港

      目标实例

      在筛选框设置条件,选择筛选出的实例。

      -

    • 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。
      • 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
      • 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
      • 不分批:用户所有待执行的机器会全部在同一批次。
    • 熔断策略:
      • 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
      • 成功率取值范围0~100,支持精确到小数点后一位。

      跳过步骤8,执行步骤9

  8. 设置“执行作业”。

    • 区域:请选择目标实例所在区域。
    • 目标实例模式:请选择作业步骤和目标实例的执行方式。
      • 所有步骤一致:所有任务在所选目标实例执行,统一使用一个分批策略。
      • 每个步骤独立:单个步骤下的任务在所选目标实例执行,每个步骤使用一个分批策略。
      • 每个任务独立:可独立设置每个作业任务执行的目标实例和分批策略
    • 作业步骤:可自定义配置作业详情。
      • 单击具体作业名称,右侧弹出“修改参数”页面。
      • 设置“输入”、“输出”参数,设置“异常处理”选项。
    • 目标实例:单击“添加实例”,设置“选择实例”。
      表3 选择实例参数说明

      参数

      说明

      示例

      选择方式

      请选择实例选择方式。

      • 手动选择:根据“企业项目”、“视图类型”、“资源类型”、“区域”和“目标实例”确认筛选条件,手动选择实例。

      手动选择

      企业项目

      在下拉列表中选择企业项目,支持选择“全部”。

      全部

      视图类型

      请选择视图类型。

      • CMDB资源视角:以资源视角选择实例列表。
      • CMDB应用视角:以应用视角选择实例列表。

      CMDB资源视角

      资源类型

      可选项“ECS”、“BMS”。

      ECS

      区域

      默认参数,不支持修改,由“执行内容”中“区域”决定。

      中国-香港

      目标实例

      在筛选框设置条件,选择筛选出的实例。

      -

    • 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。
      • 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
      • 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
      • 不分批:用户所有待执行的机器会全部在同一批次。

  9. 单击“确定”。
  10. 对于工单执行是否完成,支持以下操作:

    • 若工单执行中:
      • 暂停:单击右上方“暂停”,当前批次执行完成后下一批次暂停执行。
      • 继续:单击右上方“继续”,继续执行已暂停的批次。
      • 强制结束:单击右上方“强制结束”,结束待执行或异常的工单。
    • 若工单执行完成:根据执行状态“异常”或“成功”:
      • 异常:工单中有部分或全部实例任务执行异常。
        1. 选择“异常”批次,单击异常实例右侧“重试”,重新执行所选实例的任务。
        2. 选择“异常”批次,单击异常实例右侧“取消”,取消所选实例的任务。
      • 成功:工单执行成功。

应用诊断

  1. 登录云运维中心
  2. 在左侧导航栏选择“故障管理 > WarRoom”。
  3. 单击需要诊断的WarRoom标题。
  4. 选择需要处理的应用,单击“应用诊断”。
  5. 单击时间框,设置故障时间。

    时间框输入的时间为“结束时间”,“起始时间”为“结束时间”向前1小时。选择时间后,应用拓扑大屏展示所选时间段内应用和子应用的告警数量,右侧详情页展示应用故障详情。

  6. (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。

    勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。

  7. (可选)若应用有子应用,单击子应用。

    应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。

  8. 单击应用或子应用下组件。

    应用拓扑大屏展示该组件下的所有资源,右侧详情页展示组件故障详情。支持在拓扑大屏切换查看其它组件。支持核心云服务的指标展示,如果在应用管理中有关联APM,也可以查看链路相关指标。

  9. 单击应用拓扑右侧“告警”。

    查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。

  10. 单击应用拓扑右侧“变更”。

    查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。

  11. 单击应用拓扑右侧“故障诊断”。

    查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS、ECS、ELB资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。

    未创建过诊断或创建新诊断,具体操作如下。

    1. 单击“创建诊断”。
    2. 选择资源类型和资源。
    3. 单击“确定”。
    4. 确认“《GuestOS诊断服务前端数据授权》”,单击“同意”。

      只有故障诊断选择ECS时需要签署同意许可。

    诊断完成后,单击诊断结果列表右侧“查看详情”,查看诊断报告。