更新时间:2023-03-17 GMT+08:00

恢复Yarn数据

操作场景

MRS集群管理员可以通过FusionInsight Manager创建恢复Yarn任务,只支持创建任务手动恢复数据。

  • 只支持进行数据备份时的系统版本与当前系统版本一致时的数据恢复。
  • 当业务正常时需要恢复数据,建议手动备份最新管理数据后,再执行恢复数据操作。否则会丢失从备份时刻到恢复时刻之间的数据。
  • 建议一个恢复任务只恢复一个组件的元数据,避免因停止某个服务或实例影响其他组件的数据恢复。同时恢复多个组件数据,可能导致数据恢复失败。

对系统的影响

  • 由于资源池的信息也存储在DBService中,因此在恢复Yarn数据的时候也要手动触发一次相应时间备份的DBService的数据恢复,如果仅仅恢复Yarn数据,那么会造成Yarn存储在ZooKeeper中的数据和存储在DBService上的数据不一致,从而导致Yarn资源池异常。请务必谨慎操作,确保要恢复的Yarn数据和DBService数据保持一致。
  • 元数据恢复前,需要停止Yarn服务,在这期间所有上层应用都会受到影响,无法正常工作。
  • 元数据恢复后,会丢失从备份时刻到恢复时刻之间的数据。
  • 元数据恢复后,需要重新启动Yarn的上层应用。

前提条件

  • 如果需要从远端HDFS恢复数据,需要准备备集群。如果主集群部署为安全模式,且主备集群不是由同一个FusionInsight Manager管理,则必须配置系统互信,请参见配置跨Manager集群互信。如果主集群部署为普通模式,则不需要配置互信。
  • 主备集群必须已配置跨集群拷贝,请参见启用集群间拷贝功能
  • 检查Yarn元数据备份文件保存路径。
  • 恢复Yarn元数据需要先停止Yarn服务。
  • 登录FusionInsight Manager,请参见登录管理系统

操作步骤

  1. 在FusionInsight Manager,选择 “运维 > 备份恢复 > 备份管理”。
  2. 在任务列表指定任务的“操作”列,选择更多 > 查询历史,打开备份任务执行历史记录。

    在弹出的窗口中,在指定一次执行成功记录的“备份路径”列,单击“查看”,打开此次任务执行的备份路径信息,查找以下信息:

    • “备份对象”表示备份的数据源。
    • “备份路径”表示备份文件保存的完整路径。

      选择正确的项目,在“备份路径”手工选中备份文件的完整路径并复制。

  3. 在FusionInsight Manager,选择运维 > 备份恢复 > 恢复管理
  4. 单击“创建”。
  5. 在“任务名称”填写恢复任务的名称。
  6. 在“恢复对象”选择待操作的集群。
  7. 在“恢复配置”,勾选“元数据和其他数据”下的“Yarn”和“DBService”。

    由于资源池的信息也存储在DBService中,因此在恢复Yarn数据的时候也要手动触发一次相应时间备份的DBService的数据恢复,如果仅仅恢复Yarn数据,那么会造成Yarn存储在ZooKeeper中的数据和存储在DBService上的数据不一致,从而导致Yarn资源池异常。请务必谨慎操作,确保要恢复的Yarn数据和DBService数据保持一致。

  8. 在“DBService”的“路径类型”,选择一个备份目录的类型。具体操作请参考恢复DBService数据
  9. 在“Yarn”的“路径类型”,选择一个备份目录的类型。

    选择不同的备份目录时,对应设置如下:

    • “LocalDir”:表示备份文件保存在主管理节点的本地磁盘上。

      选择此参数值,还需要配置“源端路径”,表示要恢复的备份文件。例如,“版本号_数据源_任务执行时间.tar.gz”。

    • “RemoteHDFS”:表示备份文件保存在备集群的HDFS目录。
      选择此参数值,还需要配置以下参数:
      • “源端NameService名称”:填写备份数据集群的NameService名称。可以输入集群内置的远端集群的NameService名称:haclusterX,haclusterX1,haclusterX2,haclusterX3,haclusterX4;也可输入其他已配置的远端集群NameService名称。
      • “IP 模式”:目标IP的IP地址模式。系统会根据集群网络类型自动选择对应的IP模式,如IPv4或者IPv6。
      • “源端NameNode IP地址”:填写备集群NameNode业务平面IP地址,支持主节点或备节点。
      • “源端路径”:填写备集群保存备份数据的完整HDFS路径。例如,“备份路径/备份任务名_数据源_任务创建时间/版本号_数据源_任务执行时间.tar.gz”。
      • “队列名称”:填写备份任务执行时使用的YARN队列的名称。需和集群中已存在且状态正常的队列名称相同。
    • “NFS”:表示备份文件通过NFS协议保存在NAS中。
      选择此参数值,还需要配置以下参数:
      • “IP 模式”:目标IP的IP地址模式。系统会根据集群网络类型自动选择对应的IP模式,如IPv4或者IPv6。
      • “服务器IP地址”:填写NAS服务器IP地址。
      • “源端路径”:填写备份文件在NAS服务器中保存的完整路径。例如,“备份路径/备份任务名_数据源_任务创建时间/版本号_数据源_任务执行时间.tar.gz”。
    • “CIFS”:表示备份文件通过CIFS协议保存在NAS中。
      选择此参数值,还需要配置以下参数:
      • “IP 模式”:目标IP的IP地址模式。系统会根据集群网络类型自动选择对应的IP模式,如IPv4或者IPv6。
      • “服务器IP地址”:填写NAS服务器IP地址。
      • “端口号”:填写CIFS协议连接NAS服务器使用的端口号,默认值为“445”。
      • “用户名”:填写配置CIFS协议时设置的用户名。
      • “密码”:填写配置CIFS协议时设置的密码。
      • “源端路径”:填写备份文件在NAS服务器中保存的完整路径。例如,“备份路径/备份任务名_数据源_任务创建时间/版本号_数据源_任务执行时间.tar.gz”。
    • “SFTP”:表示备份文件通过SFTP协议保存到备份服务器中。
      选择此参数值,还需要配置以下参数:
      • “IP 模式”:目标IP的IP地址模式。系统会根据集群网络类型自动选择对应的IP模式,如IPv4或者IPv6。
      • “服务器IP地址”:填写备份数据的服务器IP地址。
      • “端口号”:填写SFTP协议连接备份服务器使用的端口号,默认值为“22”。
      • “用户名”:填写使用SFTP协议连接服务器时的用户名。
      • “密码”:填写使用SFTP协议连接服务器时的密码。
      • “源端路径”:填写备份文件在备份服务器中保存的完整路径。例如,“备份路径/备份任务名_数据源_任务创建时间/版本号_数据源_任务执行时间.tar.gz”。
    • “OBS”:表示将备份文件保存在OBS中。

      选择此参数值,还需要配置以下参数:

      • “源端路径”:填写备份文件在OBS中保存的完整路径。例如,“备份路径/备份任务名_数据源_任务创建时间/版本号_数据源_任务执行时间.tar.gz”。

        MRS 3.1.0及之后版本才支持将备份文件保存到OBS。

  10. 单击“确定”保存。
  11. 在恢复任务列表已创建任务的“操作”列,单击“执行”,开始执行恢复任务。

    • 恢复成功后进度显示为绿色。
    • 恢复成功后此恢复任务不支持再次执行。
    • 如果恢复任务在第一次执行时由于某些原因未执行成功,在排除错误原因后单击“重试”,重试恢复任务。