Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Cómputo
Elastic Cloud Server
Bare Metal Server
Auto Scaling
Image Management Service
Dedicated Host
FunctionGraph
Cloud Phone Host
Huawei Cloud EulerOS
Redes
Virtual Private Cloud
Elastic IP
Elastic Load Balance
NAT Gateway
Direct Connect
Virtual Private Network
VPC Endpoint
Cloud Connect
Enterprise Router
Enterprise Switch
Global Accelerator
Gestión y gobernanza
Cloud Eye
Identity and Access Management
Cloud Trace Service
Resource Formation Service
Tag Management Service
Log Tank Service
Config
Resource Access Manager
Simple Message Notification
Application Performance Management
Application Operations Management
Organizations
Optimization Advisor
Cloud Operations Center
Resource Governance Center
Migración
Server Migration Service
Object Storage Migration Service
Cloud Data Migration
Migration Center
Cloud Ecosystem
KooGallery
Partner Center
User Support
My Account
Billing Center
Cost Center
Resource Center
Enterprise Management
Service Tickets
HUAWEI CLOUD (International) FAQs
ICP Filing
Support Plans
My Credentials
Customer Operation Capabilities
Partner Support Plans
Professional Services
Análisis
MapReduce Service
Data Lake Insight
CloudTable Service
Cloud Search Service
Data Lake Visualization
Data Ingestion Service
GaussDB(DWS)
DataArts Studio
IoT
IoT Device Access
Otros
Product Pricing Details
System Permissions
Console Quick Start
Common FAQs
Instructions for Associating with a HUAWEI CLOUD Partner
Message Center
Seguridad y cumplimiento
Security Technologies and Applications
Web Application Firewall
Host Security Service
Cloud Firewall
SecMaster
Data Encryption Workshop
Database Security Service
Cloud Bastion Host
Data Security Center
Cloud Certificate Manager
Blockchain
Blockchain Service
Servicios multimedia
Media Processing Center
Video On Demand
Live
SparkRTC
Almacenamiento
Object Storage Service
Elastic Volume Service
Cloud Backup and Recovery
Storage Disaster Recovery Service
Scalable File Service
Volume Backup Service
Cloud Server Backup Service
Data Express Service
Dedicated Distributed Storage Service
Contenedores
Cloud Container Engine
SoftWare Repository for Container
Application Service Mesh
Ubiquitous Cloud Native Service
Cloud Container Instance
Bases de datos
Relational Database Service
Document Database Service
Data Admin Service
Data Replication Service
GeminiDB
GaussDB
Distributed Database Middleware
Database and Application Migration UGO
TaurusDB
Middleware
Distributed Cache Service
API Gateway
Distributed Message Service for Kafka
Distributed Message Service for RabbitMQ
Distributed Message Service for RocketMQ
Cloud Service Engine
EventGrid
Dedicated Cloud
Dedicated Computing Cluster
Aplicaciones empresariales
ROMA Connect
Message & SMS
Domain Name Service
Edge Data Center Management
Meeting
AI
Face Recognition Service
Graph Engine Service
Content Moderation
Image Recognition
Data Lake Factory
Optical Character Recognition
ModelArts
ImageSearch
Conversational Bot Service
Speech Interaction Service
Huawei HiLens
Developer Tools
SDK Developer Guide
API Request Signing Guide
Terraform
Koo Command Line Interface
Distribución de contenido y cómputo de borde
Content Delivery Network
Intelligent EdgeFabric
CloudPond
Soluciones
SAP Cloud
High Performance Computing
Servicios para desarrolladores
ServiceStage
CodeArts
CodeArts PerfTest
CodeArts Req
CodeArts Pipeline
CodeArts Build
CodeArts Deploy
CodeArts Artifact
CodeArts TestPlan
CodeArts Check
Cloud Application Engine
aPaaS MacroVerse
KooPhone
KooDrive
En esta página

Copia de respaldo de datos de servicio de HBase

Actualización más reciente 2023-11-20 GMT+08:00

Escenario

Para garantizar la seguridad de los datos de servicio de HBase de forma rutinaria o antes de una operación importante en HBase (como la actualización o la migración), debe realizar una copia de respaldo de los datos de servicio de HBase. Los datos de copia de respaldo se pueden utilizar para recuperar el sistema si se produce una excepción o la operación no ha logrado el resultado esperado, minimizando los impactos adversos en los servicios.

Puede crear una tarea de copia de respaldo en FusionInsight Manager para hacer una copia de respaldo de los datos del servicio de HBase. Se admiten tareas de copia de respaldo tanto automáticas como manuales.

Las siguientes situaciones pueden ocurrir durante la copia de respaldo de datos del servicio HBase:

  • Cuando un usuario crea una tabla HBase, KEEP_DELETED_CELLS se establece en false de forma predeterminada. Cuando el usuario hace una copia de respaldo de esta tabla de HBase, los datos eliminados se respaldarán y los datos basura pueden existir después de la restauración de los datos. Este parámetro se puede establecer en true manualmente cuando se crea una tabla HBase en función de los requisitos de servicio.
  • Cuando un usuario especifica manualmente la marca de tiempo al escribir datos en una tabla HBase y la hora especificada es anterior a la última hora de copia de respaldo de la tabla HBase, es posible que no se realice una copia de respaldo de los datos nuevos en tareas de copia de respaldo incrementales.
  • La función de copia de respaldo de HBase no puede realizar copias de respaldo de las listas de control de acceso (ACL) para leer, escribir, ejecutar, crear y administrar espacios de nombres o globales de HBase. Después de restaurar los datos de HBase, debe restablecer los permisos de rol en el FusionInsight Manager.
  • Si los datos de copia de respaldo del clúster en espera se pierden en una tarea de copia de respaldo de HBase existente, la siguiente copia de respaldo incremental fallará y deberá crear una tarea de copia de respaldo de HBase de nuevo. Sin embargo, la siguiente tarea de copia de respaldo completa será normal.

Prerrequisitos

  • Si es necesario realizar una copia de respaldo de los datos en el HDFS remoto, ha preparado un clúster en espera para la copia de respaldo de los datos. El modo de autenticación del clúster en espera es el mismo que el del clúster activo. Para otros modos de copia de respaldo, no es necesario preparar el clúster en espera.
  • Si el clúster activo se despliega en modo de seguridad y los clústeres activo y en espera no son gestionados por el mismo FusionInsight Manager, se ha configurado la confianza mutua. Para obtener más información, consulte Configuración de la confianza mutua Cross-Manager entre clústeres. Si el clúster activo se despliega en modo normal, no se requiere confianza mutua.
  • Se ha configurado la replicación entre clústeres para los clústeres activo y en espera. Para obtener más información, consulte Habilitación de la replicación entre clústeres.
  • El tiempo es consistente entre los clústeres activos y en espera y los servicios NTP en los clústeres activos y en espera utilizan la misma fuente de tiempo.
  • Las políticas de copia de respaldo, incluido el tipo de tarea de copia de respaldo, el período, el objeto de copia de respaldo, el directorio de copia de respaldo y la cola de Yarn que requiere la tarea de copia de respaldo, se planifican según los requisitos de servicio.
  • El HDFS del clúster en espera tiene suficiente espacio. Se recomienda guardar los archivos de copia de respaldo en un directorio personalizado.
  • En el cliente HDFS, ha ejecutado el comando hdfs lsSnapshottableDir como usuario hdfs para comprobar la lista de directorios para los que se han creado instantáneas HDFS en el clúster actual y asegurarse de que el directorio o subdirectorio principal HDFS donde se almacenan los archivos de datos que se van a hacer una copia de respaldo no tiene Instantáneas de HDFS. De lo contrario, no se puede crear la tarea de copia de respaldo.
  • Si desea realizar una copia de respaldo de los datos en el NAS, ha desplegado el servidor NAS por adelantado.
  • Los parámetros fs.defaultFS de HBase son los mismos que los de Yarn y HDFS.

Procedimiento

  1. En FusionInsight Manager, seleccione O&M > Backup and Restoration > Backup Management.
  2. Haga clic en Create.
  3. Establezca Name en el nombre de la tarea de copia de respaldo.
  4. Seleccione el clúster que se va a operar desde Backup Object.
  5. Establezca Mode en el tipo de tarea de copia de respaldo.

    Periodic indica que la tarea de copia de respaldo es ejecutada por el sistema periódicamente. Manual indica que la tarea de copia de respaldo se ejecuta manualmente.

    Tabla 1 Parámetros de copia de respaldo periódico

    Parámetro

    Descripción

    Started

    Indica la hora a la que se inicia la tarea por primera vez.

    Period

    Indica el intervalo de ejecución de la tarea. Las opciones incluyen Hours y Days.

    Backup Policy

    • Copia de respaldo completa la primera vez y copia de respaldo incremental posteriormente
    • Copia de respaldo completa cada vez
    • Copia de respaldo completa una vez cada n veces
    NOTA:
    • No se admite la copia de respaldo incremental cuando se realizan copias de respaldo de los datos de Manager y los metadatos de los componentes. Solo se admite Copia de respaldo completa cada vez.
    • Si Path Type se establece en NFS o CIFS, no se puede utilizar la copia de respaldo incremental. Cuando se utiliza la copia de respaldo incremental para la copia de respaldo de NFS o CIFS, los datos de copia de respaldo completa más recientes se actualizan cada vez que se realiza la copia de respaldo incremental. Por lo tanto, no se genera ningún nuevo punto de recuperación.

  6. En Configuration, elija HBase > HBase bajo Service data.
  7. Establezca Path Type de HBase en un tipo de directorio de copia de respaldo.

    Se admiten los siguientes tipos de directorio de copia de respaldo:

    • RemoteHDFS: indica que los archivos de copia de respaldo se almacenan en el directorio de HDFS del clúster en espera.
      Si selecciona esta opción, establezca los siguientes parámetros:
      • Destination NameService Name: indica el nombre de NameService del clúster en espera. Puede establecerlo en el nombre de NameService (haclusterX, haclusterX1, haclusterX2, haclusterX3, o haclusterX4) del clúster remoto integrado del clúster, o el nombre de NameService de un clúster remoto configurado.
      • IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
      • Target NameNode IP Address: indica la dirección IP del plano de servicio NameNode en el clúster en espera. Puede ser de un nodo activo o en espera.
      • Target Path: indica el directorio HDFS para almacenar los datos de copia de respaldo del clúster en espera. La ruta de almacenamiento no puede ser un directorio oculto de HDFS, como un directorio de instantáneas o papelera de reciclaje, o un directorio de sistema predeterminado, como /hbase o /user/hbase/backup.
      • Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
      • Queue Name: indica el nombre de la cola de Yarn utilizada para la ejecución de tareas de copia de respaldo. El nombre debe ser el mismo que el nombre de la cola que se está ejecutando correctamente en el clúster.
      • Maximum Number of Maps: indica el número máximo de map en una tarea de MapReduce. El valor predeterminado es 20.
      • Maximum Bandwidth of a Map (MB/s): indica el ancho de banda máximo de un map. El valor predeterminado es 100.
    • NFS: indica que los archivos de copia de respaldo se almacenan en el NAS mediante el protocolo NFS.
      Si selecciona esta opción, establezca los siguientes parámetros:
      • IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
      • Server IP Address: indica la dirección IP del servidor NAS.
      • Server Shared Path: indica el directorio compartido configurado del servidor NAS. (La ruta de acceso compartida del servidor no se puede establecer en el directorio raíz, y el grupo de usuarios y el grupo de propietarios de la ruta de acceso compartida deben ser nobody:nobody.)
      • Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
      • Queue Name: indica el nombre de la cola de Yarn utilizada para la ejecución de tareas de copia de respaldo. El nombre debe ser el mismo que el nombre de la cola que se está ejecutando correctamente en el clúster.
      • Maximum Number of Maps: indica el número máximo de map en una tarea de MapReduce. El valor predeterminado es 20.
      • Maximum Bandwidth of a Map (MB/s): indica el ancho de banda máximo de un map. El valor predeterminado es 100.
    • CIFS: indica que los archivos de copia de respaldo se almacenan en el NAS mediante el protocolo CIFS.
      Si selecciona esta opción, establezca los siguientes parámetros:
      • IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
      • Server IP Address: indica la dirección IP del servidor NAS.
      • Port: indica el número de puerto utilizado para conectarse al servidor NAS a través del protocolo CIFS. El valor predeterminado es 445.
      • Username: indica el nombre de usuario establecido cuando se configura el protocolo CIFS.
      • Password: indica la contraseña establecida cuando se configura el protocolo CIFS.
      • Server Shared Path: indica el directorio compartido configurado del servidor NAS. (La ruta de acceso compartida del servidor no se puede establecer en el directorio raíz, y el grupo de usuarios y el grupo de propietarios de la ruta de acceso compartida deben ser nobody:nobody.)
      • Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
      • Queue Name: indica el nombre de la cola de Yarn utilizada para la ejecución de tareas de copia de respaldo. El nombre debe ser el mismo que el nombre de la cola que se está ejecutando correctamente en el clúster.
      • Maximum Number of Maps: indica el número máximo de map en una tarea de MapReduce. El valor predeterminado es 20.
      • Maximum Bandwidth of a Map (MB/s): indica el ancho de banda máximo de un map. El valor predeterminado es 100.
    • SFTP: indica que los archivos de copia de respaldo se almacenan en el servidor mediante el protocolo SFTP.

      Si selecciona esta opción, establezca los siguientes parámetros:

      • IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
      • Server IP Address: indica la dirección IP del servidor donde se almacenan los datos de copia de respaldo.
      • Port: indica el número de puerto utilizado para conectarse al servidor de copia de respaldo a través del protocolo SFTP. El valor predeterminado es 22.
      • Username: indica el nombre de usuario para conectarse al servidor mediante el protocolo SFTP.
      • Password: indica la contraseña para conectarse al servidor mediante el protocolo SFTP.
      • Server Shared Path: indica la ruta de copia de respaldo en el servidor SFTP.
      • Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
      • Queue Name: indica el nombre de la cola de Yarn utilizada para la ejecución de tareas de copia de respaldo. El nombre debe ser el mismo que el nombre de la cola que se está ejecutando correctamente en el clúster.
      • Maximum Number of Maps: indica el número máximo de map en una tarea de MapReduce. El valor predeterminado es 20.
      • Maximum Bandwidth of a Map (MB/s): indica el ancho de banda máximo de un map. El valor predeterminado es 100.

  8. Establezca Maximum Number of Recovery Points en el número de instantáneas que se pueden retener en el clúster.
  9. Establezca Backup Content en una o varias tablas de HBase para realizar una copia de respaldo.

    Puede seleccionar los datos de copia de respaldo utilizando cualquiera de los siguientes métodos:

    • Adición de un archivo de datos de copia de respaldo

      Haga clic en el nombre de una base de datos en el árbol de navegación para mostrar todas las tablas de la base de datos y seleccione las tablas especificadas.

    • Selección del uso de expresiones regulares
      1. Haga clic en Query Regular Expression.
      2. Introduzca el espacio de nombres donde se encuentran las tablas HBase en el primer cuadro de texto según se le solicite. El espacio de nombres debe ser el mismo que el espacio de nombres existente, por ejemplo, default.
      3. Escriba una expresión regular en el segundo cuadro de texto. Se admiten expresiones regulares estándar. Por ejemplo, para obtener todas las tablas del espacio de nombres, escriba ([\s\S]*?). Para obtener tablas cuyos nombres consisten en letras y dígitos, por ejemplo, tb1, escriba tb\d*.
      4. Haga clic en Refresh para ver las tablas mostradas en Directory Name.
      5. Haga clic en Synchronize para guardar el resultado.
      NOTA:
      • Cuando escriba expresiones regulares, haga clic en o para agregar o eliminar una expresión.
      • Si la tabla o el directorio seleccionado no es correcto, haga clic en Clear Selected Node para anular la selección.

  10. Haga clic en Verify para comprobar si la tarea de copia de respaldo está configurada correctamente.

    Las posibles causas de falla de verificación son las siguientes:

    • La dirección IP del NameNode de destino es incorrecta.
    • El nombre de la cola es incorrecto.
    • El directorio primario o subdirectorio del directorio HDFS donde se almacenan los archivos de datos de la tabla HBase que se van a realizar una copia de respaldo tiene instantáneas HDFS.
    • El directorio o la tabla que se va a hacer una copia de respaldo no existe.

  11. Haga clic en OK.
  12. En la columna Operation de la tarea creada en la lista de tareas de copia de respaldo, haga clic en More y seleccione Back Up Now para ejecutar la tarea de copia de respaldo.

    Después de ejecutar la tarea de copia de respaldo, el sistema crea automáticamente un subdirectorio para cada tarea de copia de respaldo en el directorio de copia de respaldo. El formato del nombre del subdirectorio es Backup task name_Data source_Task creation time y el subdirectorio se utiliza para guardar los últimos archivos de copia de respaldo de origen de datos. Todos los conjuntos de archivos de copia de respaldo se almacenan en los directorios de instantáneas relacionados.

Utilizamos cookies para mejorar nuestro sitio y tu experiencia. Al continuar navegando en nuestro sitio, tú aceptas nuestra política de cookies. Descubre más

Comentarios

Comentarios

Comentarios

0/500

Seleccionar contenido

Enviar el contenido seleccionado con los comentarios