更新时间:2025-12-19 GMT+08:00
分享

响应本地盘换盘事件

操作场景

当系统检测到ECS实例(含裸金属类型实例)的本地盘因硬件故障、数据异常等原因导致无法正常读写时,会对受影响的ECS实例自动生成“本地盘换盘”事件。

由于本地盘不提供数据高可用能力,故障本地盘的数据可能部分或全部受损且不可恢复,建议您在收到事件通知时,立刻对重要数据进行本地盘数据备份

在本地盘修复期间,您可以随时选择重部署方式来快速恢复故障本地盘,但该方式将导致所有本地盘数据丢失并重启ECS实例,操作前需要对所有本地盘数据进行备份。

若您对本地盘换盘事件的影响或处理方式有疑问时,请勿授权并联系技术支持进行处理。

不同规格类型的ECS实例,响应“待授权”状态的“本地盘换盘”事件的方案不同,请根据业务需要选择合适的响应方案进行操作。

  • 场景1:磁盘增强型(D系列)ECS实例

    维度

    授权换盘

    重部署

    适用场景

    故障本地盘对业务无影响,对ECS实例关机操作敏感的场景

    需要快速恢复故障本地盘的场景

    业务影响

    仅丢失故障本地盘数据

    换盘期间,故障本地盘不可用

    丢失所有本地盘数据

    重部署期间,ECS实例重启

    业务是否需要离线

    数据备份范围

    备份故障本地盘数据

    备份所有本地盘数据

    是否需要重启ECS

    修复时长

    最长需要5个工作日

    立即开始重部署,实际耗时以ECS重部署时长为准

    是否支持预约操作

    支持

    不支持

    操作流程

    1. 用户收到事件通知,备份故障本地盘数据
    2. 用户预处理本地盘
      1. 卸载(即umount)损坏的本地盘设备
      2. 修改操作系统内的/etc/fstab配置文件
    3. 用户执行“授权换盘”
    4. 华为云收到授权后,对损坏的本地盘进行更换
    5. 更换成功后,用户检查业务运行情况
    1. 用户收到事件通知,备份所有本地盘数据
    2. 用户预处理本地盘,修改操作系统内的/etc/fstab配置文件
    3. 用户执行“重部署”
    4. 华为云收到授权后,对ECS实例进行重部署
    5. 重部署成功后,用户检查业务运行情况
  • 场景2:裸金属类型(带.physical后缀)ECS实例

    维度

    授权换盘

    重部署

    适用场景

    故障本地盘对业务无影响,对ECS实例关机操作敏感的场景

    需要快速恢复故障本地盘的场景

    业务影响

    仅丢失故障本地盘数据

    换盘期间,故障本地盘不可用,同时可能伴随裸金属实例重启

    丢失所有本地盘数据

    重部署期间,裸金属实例重启

    业务是否需要离线

    数据备份范围

    备份故障本地盘数据

    备份所有本地盘数据

    是否需要重启ECS

    修复时长

    最长需要5个工作日

    立即开始重部署,实际耗时以ECS重部署时长为准

    是否支持预约操作

    支持

    不支持

    操作流程

    1. 用户收到事件通知,备份故障本地盘数据
    2. 用户预处理本地盘
      1. 卸载(即umount)损坏的本地盘设备
      2. 修改操作系统内的/etc/fstab配置文件
    3. 用户执行“授权换盘”
    4. 华为云收到授权后,对损坏的本地盘进行更换
    5. 更换成功后,用户检查业务运行情况
    1. 用户收到事件通知,备份所有本地盘数据
    2. 用户预处理本地盘,修改操作系统内的/etc/fstab配置文件
    3. 用户执行“重部署”
    4. 华为云收到授权后,对ECS实例进行重部署
    5. 重部署成功后,用户检查业务运行情况

前提条件

  • 如果您通过IAM用户进行本操作,则需要在操作前对IAM用户进行授权。

    查询及响应事件操作依赖以下策略:

    • 查询事件:ecs:instanceScheduledEvents:list
    • 接受并授权执行事件:ecs:instanceScheduledEvents:accept
    • 修改预约时间:ecs:instanceScheduledEvents:update

    为IAM用户授权的操作,请参见通过IAM角色或策略授予使用ECS的权限

  • 若选择“授权换盘”方式响应“本地盘换盘”事件,在进行操作之前,请先以下操作:
    • 如需保留本地盘上的数据,请先备份故障本地盘的数据。
    • 请根据实例类型,选择对应的预处理操作指导,详细内容,请参见换盘预处理
  • 若选择“重部署”方式响应“本地盘换盘”事件,在进行操作之前,请先完成实例重部署预处理操作,为所有数据盘增加nofail参数。

    详细内容,请参见实例重部署预处理

授权换盘

  1. 登录管理控制台
  2. 单击管理控制台左上角的,选择区域和项目。
  3. 单击“”,选择“计算 > 弹性云服务器”。
  4. 在左侧导航树中,选择“事件”。
    图1 事件列表
  1. 在“事件”列表搜索框,通过以下条件过滤出待授权的“本地盘换盘”事件。
    1. 选择“事件类型 > 本地盘换盘”。
    2. 选择“事件状态 > 待授权”。
  2. 在待授权的事件“操作”列,单击“授权换盘”。
    图2 授权换盘(磁盘增强型实例)
    图3 授权换盘(裸金属类型实例)
  3. 了解风险须知后,勾选已知晓风险的提示,并单击“下一步”。
  4. 进行“授权设置”。
    • 选择“立即换盘”。

      即系统收到换盘请求后,会在5个工作日内完成换盘操作。

      图4 立即换盘
    • 选择“预约换盘”,并设置换盘时间。

      即系统收到换盘请求后,会在预约时间后5个工作日内完成换盘操作。

      图5 预约换盘

    设置预约换盘时间后,您还可以修改预约时间,详细内容,请参见修改预约时间

  5. 输入“AGREE”确定授权本地盘换盘。
  6. 单击“确定”,完成授权换盘。

    授权换盘后,“本地盘换盘”事件更新为“待执行”状态。系统收到换盘请求后,会根据授权设置将事件更新为执行中,开始进行换盘。

    待“本地盘换盘”事件更新为“执行成功”状态,本地盘换盘完成,请检查云服务器业务运行情况。

重部署

  1. 登录管理控制台
  2. 单击管理控制台左上角的,选择区域和项目。
  3. 单击“”,选择“计算 > 弹性云服务器”。
  4. 在左侧导航树中,选择“事件”。
    图6 事件列表
  1. 在“事件”列表搜索框,通过以下条件过滤出待授权的“本地盘换盘”事件。
    1. 选择“事件类型 > 本地盘换盘”。
    2. 选择“事件状态 > 待授权”。
  2. 在事件“操作”列,单击“重部署”。
    图7 重部署
  3. 了解风险须知后,勾选已知晓风险提示,并单击“下一步”。
  4. 输入“AGREE”确定进行实例重部署操作。
    图8 确定实例重部署
  5. 单击“确定”。

    确定实例重部署后,“本地盘换盘”事件更新为“待执行”状态。系统收到重部署请求后,会将事件更新为执行中,开始进行实例重部署。

    待“本地盘换盘”事件更新为“执行成功”状态,实例重部署完成,请检查云服务器业务运行情况。

修改预约时间

完成“预约换盘”方式的授权换盘操作后,“本地盘换盘”事件状态变为“待执行”,此时,您可以修改预约换盘时间。

建议您在“当前预约执行时间”前至少30分钟修改预约时间,否则可能无法设置。

  1. 登录管理控制台
  2. 单击管理控制台左上角的,选择区域和项目。
  3. 单击“”,选择“计算 > 弹性云服务器”。
  4. 在左侧导航树中,选择“事件”。
  1. 在“事件”列表搜索框,通过以下条件过滤出待执行的“本地盘换盘”事件。
    1. 选择“事件类型 > 本地盘换盘”。
    2. 选择“事件状态 > 待执行”。
  1. 在待执行的事件“操作”列,单击“修改预约时间”。
    图9 修改预约时间
  2. 设置“修改预约执行时间”,并单击“确定”,完成预约换盘时间的修改。

相关文档