更新时间:2024-12-05 GMT+08:00

快捷混沌演练

操作场景

云运维中心(Cloud Operations Center,简称COC)为用户提供安全、高效的一站式智能运维平台,满足客户集中运维诉求。云运维中心的混沌演练功能支持用户配置演练模板、攻击模板,基于模板对物理机、虚拟机或CCE容器等进行故障演练。支持故障模式管理功能。您可以通过该功能对目标实例进行故障演练。

本章节介绍如何通过云运维中心操作一台弹性云服务器ECS进行CPU使用率加压的故障演练。

操作流程

操作步骤

说明

准备工作

注册华为账号并实名认证,开通云运维中心。

步骤一:同步资源

获取当前用户所属的所有Region下资源数据并同步至云运维中心。

步骤二:创建应用

管理应用与云资源的关系,并为后续资源的监控、自动化运维等,提供统一、及时的资源环境管理服务。

步骤三:创建演练任务

针对资源预设演练方案,支持多攻击任务自由编排的故障注入组合。

步骤四:启动演练

按照已经创建的演练任务,自动化的故障注入。

准备工作

  1. 注册账号并实名认证。

    在使用云运维中心之前,请先注册华为账号并开通华为云,然后实名认证

    如果您已开通华为云并进行实名认证,请忽略此步骤。

  2. 开通云运维中心。

    新用户首次登录云运维中心 ,请先开通云运维中心

    如果您已开通云运维中心,请忽略此步骤。

步骤一:同步资源

  1. 登录云运维中心
  2. 单击总览页面左上角的,选择区域。
  3. 在左侧导航栏选择“资源管理 > 应用资源管理”,进入“资源管理”页面。
  4. 单击按钮同步资源。
    图1 同步资源

步骤二:创建应用

  1. 在左侧导航栏选择“资源管理 > 应用资源管理”,进入应用资源管理页面。
  2. 单击“应用管理”页签,进入应用管理页面。
  3. 单击“创建应用”,进入创建应用页面。
  4. 设置“应用结构类型”。
    图2 “应用结构类型”参数配置
    表1 “应用结构类型”参数说明

    参数

    示例

    说明

    应用结构类型

    轻量级应用

    请根据应用结构的复杂类型选择。

  5. 设置“应用结构配置”。
    图3 “应用结构配置”参数配置
    表2 “应用结构配置”参数说明

    参数

    示例

    说明

    应用名称

    test-application

    根据命名规则,自定义应用的名称。填写后单击“保存”,进入新建组件页面。

    组件名称

    test-component

    根据命名规则,自定义组件的名称。填写后单击“保存”,进入新建分组页面。

    分组名称

    test-group

    根据命名规则,自定义分组的名称。

    云厂商

    华为云

    请选择目标实例所在云厂商。

    区域

    华北-乌兰察布-二零三

    请选择目标实例所在区域。

    资源关联方式

    手动关联

    请选择资源关联方式。

    关联资源

    -

    请选择需要混沌演练的目标实例。选择后单击“保存”。

  6. 单击“创建”,完成应用创建。

步骤三:创建演练任务

  1. 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。
  2. 单击“演练任务”页签,进入演练任务页面。
  3. 单击“创建演练任务”,进入创建演练任务页面。
  4. 设置“基础信息”。
    图4 “基础信息”参数配置
    表3 “基础信息”参数说明

    参数

    示例

    说明

    演练任务名称

    test-drill

    根据命名规则,自定义演练任务的名称。

    期望恢复时长(分钟)

    3

    从故障发生到故障恢复的预期时间

  5. 单击“添加一个新的攻击任务,还可创建5个攻击任务”,进入添加攻击新的攻击任务页面。
  6. 设置“添加新的攻击任务”,设置完成后单击“下一步”,进入选择攻击场景页面。
    图5 “添加新的攻击任务”参数配置
    表4 “添加新的攻击任务”参数说明

    参数

    示例

    说明

    攻击目标来源

    弹性云服务器(ECS)

    请选择目标实例的来源。

    攻击任务名称

    test-attacktask

    根据命名规则,自定义攻击任务的名称。

    攻击目标

    -

    请选择目标实例。

  7. 设置“选择攻击场景”,设置完成后单击“下一步”。
    图6 “选择攻击场景”参数配置
    表5 “选择攻击场景”参数说明

    参数

    示例

    说明

    攻击类型

    主机资源

    根据攻击场景的类型区分。

    攻击场景

    CPU使用率加压

    根据命名规则,自定义攻击任务的名称。

    攻击参数

    CPU使用率(百分比):80

    故障持续时长(秒):60

    根据不同的攻击场景,配置相应的攻击参数。

  8. “监控任务配置”本次不做配置,单击“完成”。
  9. 单击“完成配置”,完成演练任务创建。

步骤四:启动演练

  1. 在左侧导航栏选择“韧性中心 > 混沌演练”页面,进入混沌演练页面。
  2. 单击“演练任务”页签,进入演练任务页面。
  3. 找到步骤三中创建的演练任务,单击操作列“启动演练”。
    图7 启动演练
  4. 了解风险提示后,单击“确认”,进入演练记录详情页面。
  5. 支持查看攻击进度和攻击详情。等待演练完成,单击“创建演练报告”支持创建演练报告。
    图8 演练记录详情