链接复制成功!
影响应用管理
操作场景
在故障发生时,若有应用受影响,用户可以在WarRoom详情中添加影响应用。对于影响应用,可以通过应用诊断检查应用详情,通过执行预案快速恢复应用。
新增影响应用
WarRoom在启动、故障定界和恢复阶段支持新增影响应用功能。
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > WarRoom”。
- 单击需要修改的WarRoom标题。
- 单击“新增影响应用”。
- 设置“新增影响应用”。
表1 新增影响应用参数说明 参数
说明
影响应用
在下拉列表选择受影响应用。
开始时间
请填写应用开始受影响的时间。
默认为创建WarRoom时间,开始时间不得晚于创建WarRoom时间。
恢复时间
可选参数。请填写应用恢复时间。
恢复时间不得早于创建WarRoom时间。
影响描述
请填写应用相关的影响描述。
限制长度1-500个字符。
- 单击“确定”。
完成影响应用新增。单击受影响应用可以查看该应用的告警、事件和变更信息。
执行预案
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > WarRoom”。
- 单击需要修改的WarRoom标题。
- 选择需要处理的应用,单击“执行预案”。
- 若选择应急预案,在下拉列表选择相应的应急预案,单击“执行”。
若没有合适的应急预案需要创建,请参考创建应急预案。
- 根据应急预案关联的任务类型。
- 设置“执行脚本”。
- 脚本入参:脚本入参在录入自定义脚本时已预置好参数名称与参数默认值。
- 执行用户:默认“root”,目标实例节点上执行脚本的用户。
- 超时时间:默认“300”秒,脚本在单个目标实例上执行的超时时间。
- 目标实例:单击“添加实例”,设置“选择实例”。
表2 选择实例参数说明 参数
说明
示例
选择方式
请选择实例选择方式。
- 手动选择:根据“企业项目”、“视图类型”、“资源类型”、“区域”和“目标实例”确认筛选条件,手动选择实例。
手动选择
企业项目
在下拉列表中选择企业项目,支持选择“全部”。
全部
视图类型
请选择视图类型。
- CMDB资源视角:以资源视角选择实例列表。
- CMDB应用视角:以应用视角选择实例列表。
CMDB资源视角
资源类型
可选项“ECS”、“BMS”。
ECS
区域
在下拉列表中选择区域。
华北-北京一
目标实例
在筛选框设置条件,选择筛选出的实例。
-
- 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。
- 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
- 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
- 不分批:用户所有待执行的机器会全部在同一批次。
- 熔断策略:
- 设置执行的成功率,当执行失败的机器数量到达根据成功率计算出的失败数量,工单状态会变为异常,并停止执行。
- 成功率取值范围0~100,支持精确到小数点后一位。
- 设置“执行作业”。
- 区域:请选择目标实例所在区域。
- 目标实例模式:请选择作业步骤和目标实例的执行方式。
- 所有步骤一致:所有任务在所选目标实例执行,统一使用一个分批策略。
- 每个步骤独立:单个步骤下的任务在所选目标实例执行,每个步骤使用一个分批策略。
- 每个任务独立:可独立设置每个作业任务执行的目标实例和分批策略。
- 作业步骤:可自定义配置作业详情。
- 单击具体作业名称,右侧弹出“修改参数”页面。
- 设置“输入”、“输出”参数,设置“异常处理”选项。
- 目标实例:单击“添加实例”,设置“选择实例”。
表3 选择实例参数说明 参数
说明
示例
选择方式
请选择实例选择方式。
- 手动选择:根据“企业项目”、“视图类型”、“资源类型”、“区域”和“目标实例”确认筛选条件,手动选择实例。
手动选择
企业项目
在下拉列表中选择企业项目,支持选择“全部”。
全部
视图类型
请选择视图类型。
- CMDB资源视角:以资源视角选择实例列表。
- CMDB应用视角:以应用视角选择实例列表。
CMDB资源视角
资源类型
可选项“ECS”、“BMS”。
ECS
区域
默认参数,不支持修改,由“执行内容”中“区域”决定。
华北-北京一
目标实例
在筛选框设置条件,选择筛选出的实例。
-
- 分批策略:可选项为“自动分批”、“手动分批”、“不分批”,只可选择其中一项。
- 自动分批:用户选择的待执行机器,会根据默认规则,自动分成多批次。
- 手动分批:用户可以根据自身需要,手动创建若干批次,然后手动将机器分配到各批次中。
- 不分批:用户所有待执行的机器会全部在同一批次。
- 单击“确定”。
- 对于工单执行是否完成,支持以下操作:
- 若工单执行中:
- 暂停:单击右上方“暂停”,当前批次执行完成后下一批次暂停执行。
- 继续:单击右上方“继续”,继续执行已暂停的批次。
- 强制结束:单击右上方“强制结束”,结束待执行或异常的工单。
- 若工单执行完成:根据执行状态“异常”或“成功”:
- 异常:工单中有部分或全部实例任务执行异常。
- 选择“异常”批次,单击异常实例右侧“重试”,重新执行所选实例的任务。
- 选择“异常”批次,单击实例上方“批量重试”,重新执行当前批次下所有“异常”的任务。
- 选择“异常”批次,单击异常实例右侧“取消”,取消所选实例的任务。
- 选择“异常”批次,单击实例上方“批量取消”,取消当前批次下所有“异常”的任务。
- 成功:工单执行成功。
- 异常:工单中有部分或全部实例任务执行异常。
- 若工单执行中:
应用诊断
- 登录云运维中心。
- 在左侧导航栏选择“故障管理 > WarRoom”。
- 单击需要修改的WarRoom标题。
- 选择需要处理的应用,单击“应用诊断”。
- 单击时间框,设置故障时间。
时间框输入的时间为“结束时间”,“起始时间”为“结束时间”向前1小时。选择时间后,应用拓扑大屏展示所选时间段内应用和子应用的告警数量,右侧详情页展示应用故障详情。
- (可选)勾选“自动刷新”,自动刷新下拉列表选择刷新频率。
勾选“自动刷新”后,“结束时间”按照刷新频率自动刷新到系统当前时间。
- (可选)若应用有子应用,单击子应用。
应用拓扑大屏展示该子应用下的所有组件,右侧详情页展示子应用故障详情。支持在拓扑大屏切换查看其它子应用。
- 单击应用或子应用下组件。
应用拓扑大屏展示该组件下的所有资源,右侧详情页展示组件故障详情。支持在拓扑大屏切换查看其它组件。支持核心云服务的指标展示,如果在应用管理中有关联APM,也可以查看链路相关指标。
- 单击应用拓扑右侧“告警”。
查看应用告警,列表展示告警产生时间范围在右侧时间轴内的告警。支持选择左边拓扑对象后,自动筛选选择对象的告警信息。
- 单击应用拓扑右侧“变更”。
查看应用变更,列表展示变更时间范围在右侧时间轴内的变更。
- 单击应用拓扑右侧“故障诊断”。
查看资源的故障诊断数据,可以对应用的DCS、RDS、DMS资源进行诊断。支持选择左边拓扑对象后,自动筛选选择对象的诊断信息。
未创建过诊断或创建新诊断,具体操作如下。
- 单击“创建诊断”。
- 选择资源类型和资源。
- 单击“确定”。
- 确认“《GuestOS诊断服务前端数据授权》”,单击“同意”。
诊断完成后,单击诊断结果列表右侧“查看详情”,查看诊断报告。