Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

Copia de respaldo de metadatos de ClickHouse

Escenario

Para garantizar la seguridad de los metadatos de ClickHouse o antes de una operación importante (como la actualización o la migración), debe realizar una copia de respaldo de los metadatos de ClickHouse. Los datos de copia de respaldo se pueden utilizar para recuperar el sistema si se produce una excepción o la operación no ha logrado el resultado esperado, minimizando los impactos adversos en los servicios.

Puede crear una tarea de copia de respaldo en FusionInsight Manager para realizar una copia de respaldo de los metadatos de ClickHouse. Se admiten tareas de copia de respaldo tanto automáticas como manuales.

Esta función solo es compatible con MRS 3.1.0 o posterior.

Prerrequisitos

  • Si es necesario realizar una copia de respaldo de los datos en el HDFS remoto, ha preparado un clúster en espera para la copia de respaldo de los datos. El modo de autenticación del clúster en espera es el mismo que el del clúster activo. Para otros modos de copia de respaldo, no es necesario preparar el clúster en espera.
  • El tipo de copia de respaldo, el período, la política y otras especificaciones se han planificado en función de los requisitos de servicio y se ha comprobado si Data storage path/LocalBackup/ tiene suficiente espacio en los nodos de gestión activo y en espera.
  • Si los clústeres activos y en espera se despliegan en modo de seguridad y no son gestionados por el mismo FusionInsight Manager, se debe configurar la confianza mutua. Para obtener más información, consulte Configuración de la confianza mutua Cross-Manager entre clústeres. Si los clústeres activos y en espera se despliegan en modo normal, no se requiere confianza mutua.
  • El tiempo es consistente entre los clústeres activos y en espera y los servicios NTP en los clústeres activos y en espera utilizan la misma fuente de tiempo.
  • En el clúster activo/en espera, si se hace una copia de respaldo remota de los datos en HDFS, asegúrese de que el valor de HADOOP_RPC_PROTECTION de ClickHouse es el mismo que el de hadoop.rpc.protection de HDFS.

Procedimiento

  1. En FusionInsight Manager, seleccione O&M > Backup and Restoration > Backup Management.
  2. Haga clic en Create.
  3. Establezca Name en el nombre de la tarea de copia de respaldo.
  4. Seleccione el clúster que se va a operar desde Backup Object.
  5. Establezca Mode en el tipo de tarea de copia de respaldo. Periodic indica que la tarea de copia de respaldo se ejecuta periódicamente. Manual indica que la tarea de copia de respaldo se ejecuta manualmente.

    Para crear una tarea de copia de respaldo periódica, establezca los siguientes parámetros:
    • Started: indica la hora en la que se inicia la tarea por primera vez.
    • Period: indica el intervalo de ejecución de la tarea. Las opciones incluyen Hours y Days.
    • Backup Policy: Solo se admite el uso de Full backup every time.

  6. En Configuration, seleccione ClickHouse en Metadata and other data.
  7. Establezca Path Type de ClickHouse en un tipo de directorio de copia de respaldo.

    Se admiten los siguientes tipos de directorio de copia de respaldo:
    • LocalDir: indica que los archivos de copia de respaldo se almacenan en el disco local del nodo de gestión activo y el nodo de gestión en espera sincroniza automáticamente los archivos de copia de respaldo.

      El directorio de almacenamiento predeterminado es Data storage path/LocalBackup/, por ejemplo, /srv/BigData/LocalBackup.

      Si selecciona esta opción, debe establecer el número máximo de réplicas para especificar el número de conjuntos de archivos de copia de respaldo que se pueden conservar en el directorio de copia de respaldo.

    • RemoteHDFS: indica que los archivos de copia de respaldo se almacenan en el directorio de HDFS del clúster en espera.

      Esta opción de valor está disponible solo después de configurar el entorno haciendo referencia a ¿Cómo configuro el entorno al crear una tarea de copia de respaldo de ClickHouse en el FusionInsight Manager y establecer el tipo de ruta en RemoteHDFS?.

      También debe configurar los siguientes parámetros:
      • Destination NameService Name: indica el nombre de NameService del clúster en espera, por ejemplo, hacluster. Puede obtenerlo en la página NameService Management de HDFS del clúster en espera.
      • IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
      • Target NameNode IP Address: indica la dirección IP del plano de servicio NameNode en el clúster en espera. Puede ser de un nodo activo o en espera.
      • Target Path: indica el directorio HDFS para almacenar los datos de copia de respaldo del clúster en espera. La ruta de almacenamiento no puede ser un directorio oculto de HDFS, como un directorio de instantáneas o papelera de reciclaje, o un directorio de sistema predeterminado, como /hbase o /user/hbase/backup.
      • Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.

  8. Haga clic en OK.
  9. En la columna Operation de la tarea creada en la lista de tareas de copia de respaldo, haga clic en More y seleccione Back Up Now para ejecutar la tarea de copia de respaldo.

    Después de ejecutar la tarea de copia de respaldo, el sistema crea automáticamente un subdirectorio para cada tarea de copia de respaldo en el directorio de copia de respaldo. El formato del nombre del subdirectorio es de Backup task name_Task creation time y el subdirectorio se utiliza para guardar los archivos de copia de respaldo de origen de datos. El formato del nombre del archivo de copia de respaldo es Data source_Task execution time.tar.gz.