计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
弹性伸缩 AS
镜像服务 IMS
专属主机 DeH
函数工作流 FunctionGraph
云手机服务器 CPH
Huawei Cloud EulerOS
网络
虚拟私有云 VPC
弹性公网IP EIP
虚拟专用网络 VPN
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
VPC终端节点 VPCEP
云连接 CC
企业路由器 ER
企业交换机 ESW
全球加速 GA
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
边缘安全 EdgeSec
威胁检测服务 MTD
CDN与智能边缘
内容分发网络 CDN
CloudPond云服务
智能边缘云 IEC
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
云搜索服务 CSS
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
数据可视化 DLV
数据湖工厂 DLF
湖仓构建 LakeFormation
企业应用
云桌面 Workspace
应用与数据集成平台 ROMA Connect
云解析服务 DNS
专属云
专属计算集群 DCC
IoT物联网
IoT物联网
设备接入 IoTDA
智能边缘平台 IEF
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
国际站常见问题
ICP备案
我的凭证
支持计划
客户运营能力
合作伙伴支持计划
专业服务
区块链
区块链服务 BCS
Web3节点引擎服务 NES
解决方案
SAP
高性能计算 HPC
视频
视频直播 Live
视频点播 VOD
媒体处理 MPC
实时音视频 SparkRTC
数字内容生产线 MetaStudio
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
存储容灾服务 SDRS
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
专属分布式存储服务 DSS
容器
云容器引擎 CCE
容器镜像服务 SWR
应用服务网格 ASM
华为云UCS
云容器实例 CCI
管理与监管
云监控服务 CES
统一身份认证服务 IAM
资源编排服务 RFS
云审计服务 CTS
标签管理服务 TMS
云日志服务 LTS
配置审计 Config
资源访问管理 RAM
消息通知服务 SMN
应用运维管理 AOM
应用性能管理 APM
组织 Organizations
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
应用身份管理服务 OneAccess
数据库
云数据库 RDS
文档数据库服务 DDS
数据管理服务 DAS
数据复制服务 DRS
云数据库 GeminiDB
云数据库 GaussDB
分布式数据库中间件 DDM
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
人脸识别服务 FRS
图引擎服务 GES
图像识别 Image
内容审核 Moderation
文字识别 OCR
AI开发平台ModelArts
图像搜索 ImageSearch
对话机器人服务 CBS
华为HiLens
视频智能分析服务 VIAS
语音交互服务 SIS
应用中间件
分布式缓存服务 DCS
API网关 APIG
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
多活高可用服务 MAS
事件网格 EG
企业协同
华为云会议 Meeting
云通信
消息&短信 MSGSMS
云生态
合作伙伴中心
云商店
开发者工具
SDK开发指南
API签名指南
Terraform
华为云命令行工具服务 KooCLI
其他
产品价格详情
系统权限
管理控制台
客户关联华为云合作伙伴须知
消息中心
公共问题
开发与运维
应用管理与运维平台 ServiceStage
软件开发生产线 CodeArts
需求管理 CodeArts Req
部署 CodeArts Deploy
性能测试 CodeArts PerfTest
编译构建 CodeArts Build
流水线 CodeArts Pipeline
制品仓库 CodeArts Artifact
测试计划 CodeArts TestPlan
代码检查 CodeArts Check
代码托管 CodeArts Repo
云应用引擎 CAE
开天aPaaS
云消息服务 KooMessage
云手机服务 KooPhone
云空间服务 KooDrive
本文导读

展开导读

备份恢复简介

更新时间:2024-11-29 GMT+08:00

概述

FusionInsight Manager提供对集群内的用户数据及系统数据的备份恢复能力,备份功能按组件提供。系统支持备份Manager的数据、组件元数据及业务数据。

备份功能支持将数据备份至本地磁盘(LocalDir)、本端HDFS(LocalHDFS)、远端HDFS(RemoteHDFS)、NAS(NFS/CIFS)、SFTP服务器(SFTP)、OBS,具体操作请参考备份数据

对于支持多服务的组件,支持同服务多个实例的备份恢复功能且备份恢复操作与自身服务实例一致。

备份恢复任务的使用场景如下:

  • 用于日常备份,确保系统及组件的数据安全。
  • 当系统故障导致无法工作时,使用已备份的数据完成恢复操作。
  • 当主集群完全故障,需要创建一个与主集群完全相同的镜像集群,可以使用已备份的数据完成恢复操作。
表1 根据业务需要备份Manager配置数据

备份类型

备份内容

备份目录类型

OMS

默认备份集群管理系统中的数据库数据(不包含告警数据)以及配置数据。

  • LocalDir
  • LocalHDFS
  • RemoteHDFS
  • NFS
  • CIFS
  • SFTP
  • OBS
表2 根据业务需要备份组件元数据或其他数据

备份类型

备份内容

备份目录类型

DBService

备份DBService管理的组件(Loader、Metadata、Hive、Spark、Oozie、Hue、CDL和Redis)的元数据。对于安装了多服务的集群,包含多个Hive和Spark服务实例的元数据。

  • LocalDir
  • LocalHDFS
  • RemoteHDFS
  • NFS
  • CIFS
  • SFTP
  • OBS

Flink

Flink的元数据。

  • LocalDir
  • LocalHDFS
  • RemoteHDFS

Kafka

Kafka的元数据。

  • LocalDir
  • LocalHDFS
  • RemoteHDFS
  • NFS
  • CIFS
  • OBS

NameNode

备份HDFS元数据。添加多个NameService后,支持不同NameService的备份恢复功能且备份恢复操作与默认实例“hacluster”一致。

  • LocalDir
  • RemoteHDFS
  • NFS
  • CIFS
  • SFTP
  • OBS

Yarn

备份Yarn服务资源池相关信息。

HBase

HBase系统表的tableinfo文件和数据文件。

Solr

Solr的元数据。

  • LocalDir
  • LocalHDFS
  • NFS
  • CIFS
  • SFTP

Elasticsearch

Elasticsearch元数据,即存在于ZooKeeper上的与Elasticsearch安全功能相关的数据。

  • LocalDir
  • RemoteHDFS
  • NFS
  • CIFS

Redis

Redis的业务数据。

  • LocalHDFS

IoTDB

IoTDB的元数据。

  • LocalDir
  • NFS
  • RemoteHDFS
  • CIFS
  • SFTP

ClickHouse

ClickHouse的元数据。

  • LocalDir
  • RemoteHDFS
  • OBS

Containers

Containers的元数据。

  • LocalDir
  • LocalHDFS
  • RemoteHDFS

RTDService

RTDService的元数据。

  • LocalDir
  • LocalHDFS
  • RemoteHDFS
表3 根据业务需要备份特定组件业务数据

备份类型

备份内容

备份目录类型

HBase

备份表级别的用户数据。对于安装了多服务的集群,支持多个HBase服务实例的备份恢复功能且备份恢复操作与HBase服务实例一致。

  • RemoteHDFS
  • NFS
  • CIFS
  • SFTP
  • OBS

HDFS

备份用户业务对应的目录或文件。

说明:

加密目录不支持备份恢复。

  • RemoteHDFS
  • NFS
  • CIFS
  • SFTP

Hive

备份表级别的用户数据。对于安装了多服务的集群,支持多个Hive服务实例的备份恢复功能且备份恢复操作与Hive服务实例一致。

Elasticsearch

备份索引数据。对于安装了多服务的集群,支持多个Elasticsearch服务实例的备份恢复功能且备份恢复操作与Elasticsearch服务实例一致。

  • RemoteHDFS
  • NFS

Solr

备份索引数据。对于安装了多服务的集群,支持多个Solr服务实例的备份恢复功能且备份恢复操作与Solr服务实例一致。

  • RemoteHDFS

IoTDB

备份IoTDB业务数据。

  • RemoteHDFS

ClickHouse

备份表级别的用户数据。

  • RemoteHDFS
  • OBS

MOTService

备份MOTService业务数据。

  • RemoteHDFS

需要特别说明的是,部分组件不提供单独的数据备份与恢复功能:

  • Kafka支持副本特性,在创建主题时可指定多个副本来备份数据。
  • CDL的数据存储在DBService与Kafka服务中,系统管理员可以通过创建备份DBService和Kafka的任务来备份数据。
  • Mapreduce和Yarn的数据存放在HDFS上,故其依赖HDFS提供备份与恢复即可。
  • ZooKeeper中存储的业务数据,其备份恢复能力由各上层组件按需独立实现。

原理

任务

在进行备份恢复之前,需要先创建备份恢复任务,并指定任务的参数,例如任务名称、备份数据源和备份文件保存的目录类型等等。通过执行备份恢复任务,用户可完成数据的备份恢复需求。在使用Manager执行恢复HDFS、HBase、Elasticsearch、Hive和NameNode数据时,无法访问集群。

每个备份任务可同时备份不同的数据源,每个数据源将生成独立的备份文件,每次备份的所有备份文件组成一个备份文件集,可用于恢复任务。备份任务支持将备份文件保存在Linux本地磁盘、本集群HDFS与备集群HDFS中。

备份任务提供全量备份或增量备份的策略,云数据备份任务不支持增量备份策略。如果备份的路径类型是NFS或CIFS,不建议使用增量备份功能。因为在NFS或CIFS备份时使用增量备份时,每次增量备份都会刷新最近一次全量备份的备份数据,所以不会产生新的恢复点。

说明:

任务运行规则:

  • 某个任务已经处于执行状态,则当前任务无法重复执行,其他任务也无法启动。
  • 周期任务自动执行时,距离该任务上次执行的时间间隔需要在120秒以上,否则任务推迟到下个周期启动。手动启动任务无时间间隔限制。
  • 周期任务自动执行时,当前时间不得晚于任务开始时间120秒以上,否则任务推迟到下个周期启动。
  • 周期任务锁定时无法自动执行,需要手动解锁。
  • OMS、DBService、Kafka、MOTService和NameNode备份任务开始执行前,若主管理节点“LocalBackup”分区可用空间小于20GB,则无法开始执行。

管理员在规划备份恢复任务时,请严格根据业务逻辑、数据存储结构、数据库或表关联关系,选择需要备份或者恢复的数据。系统默认创建间隔为1小时的周期备份任务“default-oms”、“default-集群ID”,支持全量备份OMS及集群的DBService、NameNode等元数据到本地磁盘。

快照

系统通过快照技术,快速备份数据。快照包含HBase快照、HDFS快照和Elasticsearch快照。

  • HBase快照

    HBase快照是HBase表在特定时间的一个备份,该备份文件不复制业务数据,不影响RegionServer。HBase快照主要复制表的元数据,包含table descriptor,region info和HFile的引用信息。通过这些元数据信息可以恢复快照时间点之前的数据。

  • HDFS快照

    HDFS快照是HDFS文件系统在特定时间点的只读备份副本,主要用于数据备份、用户误操作保护和灾难恢复的场景。

    任意HDFS目录均可以配置启用快照功能并创建对应的快照文件,为目录创建快照前系统会自动启用此目录的快照功能。创建快照不会对正常的HDFS操作有任何影响。每个HDFS目录最多可创建65536个快照。

    如果一个HDFS目录已创建快照,那么在快照完全删除以前,此目录无法删除或修改名称。该目录的上级目录或子目录也无法再创建快照。

  • Elasticsearch快照

    Elasticsearch快照是利用Elasticsearch提供的备份集群中索引数据的策略——snapshot API。在特定时间来备份当前集群的状态和数据,并保存到指定的快照仓库中。第一个快照会是一个数据的完整拷贝,但所有后续的快照保留的是已存快照和新数据之间的差异。

DistCp

DistCp(distributed copy)是一个用于在本集群HDFS中或不同集群HDFS间进行大量数据复制的工具。在HBase、HDFS、Elasticsearch或Hive元数据的备份恢复任务中,如果选择将数据备份在备集群HDFS中,系统将调用DistCp完成操作。主备集群请选择安装相同版本的MRS软件版本并安装集群系统。

DistCp使用Mapreduce来影响数据的分布、异常处理及恢复和报告,此工具会把指定列表中包含的多个源文件和目录输入不同的Map任务,每个Map任务将复制列表中指定文件对应分区的数据。

使用DistCp在两个集群的HDFS间进行数据复制,集群双方需要分别配置互信(同一个FusionInsight Manager管理下的集群不需要配置互信)和启用集群间拷贝功能。集群数据备份到另一个集群的HDFS时,需要安装Yarn组件,否则备份失败。

本地快速恢复

使用DistCp将本集群HBase、HDFS和Hive数据备份在备集群HDFS中以后,本集群HDFS保留了备份数据的快照。用户可以通过创建本地快速恢复任务,直接从本集群HDFS的快照文件中恢复数据。

NAS

NAS(Network Attached Storage)是一种特殊的专用数据存储服务器,包括存储器件和内嵌系统软件,可提供跨平台文件共享功能。利用NFS(支持NFSv3、NFSv4)和CIFS(支持SMBv2、SMBv3)协议,用户可以连通MRS的业务平面与NAS服务器,将数据备份至NAS或从NAS恢复数据。

说明:
  • 数据备份至NAS前,系统会自动将NAS共享地址挂载为备份任务执行节点的本地分区。在备份结束后,系统会卸载备份任务执行节点的NAS共享分区。
  • 为防止备份恢复失败,数据备份及恢复期间,请勿访问NAS服务器挂载至本地的共享地址,如:“/srv/BigData/LocalBackup/nas”。
  • 业务数据备份至NAS时,会使用DistCp。

规格

表4 备份恢复特性规格

项目

参数

备份或恢复任务最大数量(个)

100

同一集群同时运行的任务数量(个)

1

等待运行的任务最大数量(个)

199

Linux本地磁盘最大备份文件大小(GB)

600

说明:

若业务数据存储在ZooKeeper中的上层组件,在备份恢复这类数据时,需确保单个备份或恢复任务的znode数量不会过大,否则会造成任务失败,并影响Zookeeper的服务性能。可通过如下方法确认单个备份或恢复任务的znode数量:

  • 单个备份或恢复任务的znode数量要少于操作系统的文件句柄限制。查看句柄限制的方式如下:
    1. 使用shell命令输入:cat /proc/sys/fs/file-max,用于查看系统级的最大限制。
    2. 使用shell命令输入:ulimit -n,用于查看用户级的限制。
  • 对于父目录的znode数量超过上述限制的情形,可以通过其子目录进行批量备份与恢复。使用Zookeeper提供的客户端脚本查看znode数量的方式:
    1. 在FusionInsight Manager首页,选择“集群 > 服务 > Zookeeper > 实例”,查看Zookeeper各角色的管理IP。
    2. 登录客户端所在节点,执行如下命令:

      zkCli.sh -server ip:port,其中ip可以为任意管理IP,port默认值是2181。

    3. 当看到如下输出信息时,表示已经成功连接上Zookeeper服务器。
      WatchedEvent state:SyncConnected type:None path:null
      [zk: ip:port(CONNECIED) 0]
    4. 使用getusage命令查看待备份目录的znode数量,例如:

      getusage /hbase/region,输出结果中"Node count=xxxxxx"即表示region目录下存储的znode数量。

表5 “default”任务规格

项目

OMS

Elasticsearch

HBase

IoTDB

ClickHouse

Kafka

DBService

Flink

NameNode

备份周期

1小时

最大备份数

168个(7天历史数据)

24个(1天历史数据)

单个备份文件最大大小

10MB

20MB

10 MB

10 MB

20 MB

512 MB

100 MB

1GB

20GB

最大占用磁盘大小

1.64GB

3.28GB

1.64 GB

1.64 GB

3.28 GB

84 GB

16.41GB

168GB

480GB

备份数据保存位置

主备管理节点“数据存放路径/LocalBackup/”

说明:
  • HDFS、Hive、HBase、Elasticsearch执行周期备份时,受保护目录会创建快照。受快照机制影响删除两次备份之间的数据不会立即释放磁盘空间。
  • 默认任务保存的备份数据,请管理员根据企业运维要求,定期转移并保存到集群外部。
  • 管理员可直接创建DistCp备份任务将OMS、DBService和NameNode等的数据保存到外部集群。
  • 集群数据的备份任务运行时长可根据要备份的数据量除以集群与备份设备之间的网络带宽来计算得出,在实际场景中,建议将计算得出的时常乘以1.5作为任务执行时长参考值。
  • 执行数据备份任务会对集群的最大IO性能产生影响,建议备份任务运行时间与集群业务高峰错开。

我们使用cookie来确保您的高速浏览体验。继续浏览本站,即表示您同意我们使用cookie。 详情

文档反馈

文档反馈

意见反馈

0/500

标记内容

同时提交标记内容