更新时间:2024-11-12 GMT+08:00

恢复Doris业务数据

操作场景

在用户意外修改、删除或需要找回数据时,系统管理员对Doris进行重大操作(如升级、重大数据调整等)后,系统数据出现异常或未达到预期结果,模块全部故障无法使用,或者迁移数据到新集群的场景中,需要对Doris进行恢复数据操作。

系统管理员可以通过FusionInsight Manager创建恢复Doris任务并恢复数据。只支持创建任务手动恢复数据。

用户在执行备份恢复任务时,需要根据业务场景管理统一的恢复点,防止影响业务正常运行。

  • 该章节仅适用于MRS 3.3.1及之后版本集群。
  • 只支持进行数据备份时的系统版本与当前系统版本一致时的数据恢复。
  • 当业务正常时需要恢复数据,建议手动备份最新管理数据后,再执行恢复数据操作。否则会丢失从备份时刻到恢复时刻之间的Doris数据。

对系统的影响

数据恢复后,会丢失从备份时刻到恢复时刻之间的数据。

前提条件

  • 如果需要从远端HDFS恢复数据,需满足以下条件:
    • 需准备一个用于恢复数据的备集群,且该集群已完成数据备份,详细操作请参见备份Doris业务数据。如果主集群部署为安全模式,且主备集群不是由同一个FusionInsight Manager管理,则必须配置系统互信,请参见配置MRS集群间互信。如果主集群部署为普通模式,则不需要配置互信。
    • 主集群内至少需要部署一个Doris服务的DBroker实例。
    • 主备集群上的时间必须与备集群一致,而且主备集群上的NTP服务必须使用同一个时间源。
    • 需确保主备集群中Doris和HDFS的“hadoop.rpc.protection”配置项的值保持一致。
  • 如果需要从OBS恢复数据,需要当前Doris集群已对接OBS,并具有访问OBS的权限。
  • 规划好恢复数据保存表的数据库,数据表在HDFS的保存位置,以及访问恢复数据的用户清单。
  • 检查Doris备份文件保存路径。
  • 停止Doris的上层应用。

操作步骤

  1. 在FusionInsight Manager,选择“运维 > 备份恢复 > 备份管理”。
  2. 在任务列表指定任务的“操作”列,选择“更多 > 查询历史”,打开备份任务执行历史记录。

    在弹出的窗口中,在指定一次执行成功记录的“备份路径”列,单击“查看”,打开此次任务执行的备份路径信息,查找以下信息:

    • “备份对象”表示备份的数据源。
    • “备份路径”表示备份文件保存的完整路径。

      选择正确的项目,在“备份路径”手工选中备份文件的完整路径并复制。

  3. 选择“恢复管理 > 创建”。
  4. 在“任务名称”填写恢复任务的名称。
  5. 在“恢复对象”选择待操作的集群。
  6. 在“恢复配置”的“业务数据”下,勾选“Doris”。
  7. 在“Doris”的“路径类型”,选择一个恢复目录的类型。

    表1 恢复数据

    路径类型

    参数说明

    RemoteHDFS

    表示备集群中存放备份文件的HDFS目录。选择此参数值,还需要配置以下参数:
    • “源端NameService名称”:填写备份数据集群的NameService名称。可在备集群HDFS服务的“管理NameService”页面获取,例如“hacluster”。
    • “IP 模式”:目标IP的IP地址模式。系统会根据集群网络类型自动选择对应的IP模式,如IPv4或者IPv6。
    • “源端NameNode IP地址”:填写备集群NameNode业务平面IP地址。
    • “源端NameNode RPC端口”:填写备集群HDFS配置“dfs.namenode.rpc.port”的参数值。
    • “DBroker IP地址”:填写一个本集群DBroker角色的业务平面IP地址,该DBroker将用于恢复时传输数据。
    • “源端路径”:参考2中获取的“备份路径”,填写备集群保存备份数据的完整HDFS路径。例如,“备份路径/备份任务名_数据源_任务创建时间/”。

    OBS

    表示从OBS中恢复数据。选择此参数值,还需要配置以下参数:

    “源端路径”:参考2中获取的“备份路径”,填写备份文件在OBS中保存的完整路径。例如:“备份路径/备份任务名_数据源_任务创建时间/”。

  8. 单击“刷新”,然后选择一个已备份的Doris备份文件集。
  9. 在“数据配置”的“数据选择”中,根据业务需要勾选一个或多个需要恢复的已备份数据。

    配置约束:

    • 本集群Doris中已存在与所选备份数据原数据库同名的数据库。
    • 备份数据会按备份表的原名称恢复到同名数据库中。
    • 如果存在同名表,须保证两张表的表结构完全一致。表结构包括:表名、列、分区、物化视图等。

  10. 在“保持原数据表的所有配置”选择“true”,表示将沿用备份数据的配置,如表副本数。选择“false”表示使用默认配置创建表。
  11. 单击“确定”保存。
  12. 在恢复任务列表已创建任务的“操作”列,单击“执行”,开始执行恢复任务。

    • 恢复成功后进度显示为绿色。
    • 恢复成功后此恢复任务不支持再次执行。
    • 如果恢复任务在第一次执行时由于某些原因未执行成功,在排除错误原因后单击“重试”,重试恢复任务。