Copia de respaldo de los datos del Manager
Escenario
Para garantizar la seguridad de los datos de FusionInsight Manager de forma rutinaria o antes y después de una operación crítica (como la ampliación y la reducción de capacidad) en FusionInsight Manager, debe realizar una copia de respaldo de los datos de FusionInsight Manager. Los datos de copia de respaldo se pueden utilizar para recuperar el sistema si se produce una excepción o la operación no ha logrado el resultado esperado, minimizando los impactos adversos en los servicios.
Puede crear una tarea de copia de respaldo en el FusionInsight Manager para realizar una copia de respaldo de los datos del Manager. Se admiten tareas de copia de respaldo tanto automáticas como manuales.
Prerrequisitos
- Si es necesario realizar una copia de respaldo de los datos en el HDFS remoto, ha preparado un clúster en espera para la copia de respaldo de los datos. El modo de autenticación del clúster en espera es el mismo que el del clúster activo. Para otros modos de copia de respaldo, no es necesario preparar el clúster en espera.
- Si el clúster activo se despliega en modo de seguridad y los clústeres activo y en espera no son gestionados por el mismo FusionInsight Manager, se ha configurado la confianza mutua. Para obtener más información, consulte Configuración de la confianza mutua Cross-Manager entre clústeres. Si el clúster activo se despliega en modo normal, no se requiere confianza mutua.
- Se ha configurado la replicación entre clústeres para los clústeres activo y en espera. Para obtener más información, consulte Habilitación de la replicación entre clústeres.
- El tiempo es consistente entre los clústeres activos y en espera y los servicios NTP en los clústeres activos y en espera utilizan la misma fuente de tiempo.
- El tipo de copia de respaldo, el período, la política y otras especificaciones se han planificado en función de los requisitos de servicio y se ha comprobado si Data storage path/LocalBackup/ tiene suficiente espacio en los nodos de gestión activo y en espera.
- Si desea realizar una copia de respaldo de los datos en el NAS, ha desplegado el servidor NAS por adelantado.
- Si desea realizar una copia de respaldo de los datos en OBS, ha conectado el clúster actual a OBS y tiene el permiso para acceder a OBS.
Procedimiento
- En FusionInsight Manager, seleccione O&M > Backup and Restoration > Backup Management.
- Haga clic en Create.
Figura 1 Creación de una tarea de copia de respaldo.
- Establezca Name en el nombre de la tarea de copia de respaldo.
- Ajusta Backup Object a OMS.
- Establezca Mode en el tipo de tarea de copia de respaldo.
Periodic indica que la tarea de copia de respaldo es ejecutada por el sistema periódicamente. Manual indica que la tarea de copia de respaldo se ejecuta manualmente.
Tabla 1 Parámetros de copia de respaldo periódico Parámetro
Descripción
Started
Indica la hora a la que se inicia la tarea por primera vez.
Period
Indica el intervalo de ejecución de la tarea. Las opciones incluyen Hours y Days.
Backup Policy
- Copia de respaldo completa la primera vez y copia de respaldo incremental posteriormente
- Copia de respaldo completa cada vez
- Copia de respaldo completa una vez cada n veces
NOTA:- No se admite la copia de respaldo incremental cuando se realizan copias de respaldo de los datos de Manager y los metadatos de los componentes. Solo se admite Copia de respaldo completa cada vez.
- Si Path Type se establece en NFS o CIFS, no se puede utilizar la copia de respaldo incremental. Cuando se utiliza la copia de respaldo incremental para la copia de respaldo de NFS o CIFS, los datos de copia de respaldo completa más recientes se actualizan cada vez que se realiza la copia de respaldo incremental. Por lo tanto, no se genera ningún nuevo punto de recuperación.
- En Configuration, seleccione OMS.
- Establecer Path Type de OMS en un tipo de directorio de copia de respaldo.
Se admiten los siguientes tipos de directorio de copia de respaldo:
- LocalDir: indica que los archivos de copia de respaldo se almacenan en el disco local del nodo de gestión activo y el nodo de gestión en espera sincroniza automáticamente los archivos de copia de respaldo.
El directorio de almacenamiento predeterminado es Data storage path/LocalBackup/, por ejemplo, /srv/BigData/LocalBackup.
Si selecciona esta opción, debe establecer el número máximo de réplicas para especificar el número de conjuntos de archivos de copia de respaldo que se pueden conservar en el directorio de copia de respaldo.
- LocalHDFS: indica que los archivos de copia de respaldo se almacenan en el directorio de HDFS del clúster actual.
Si selecciona esta opción, establezca los siguientes parámetros:
- Target Path: indica el directorio de HDFS para almacenar los archivos de copia de respaldo. La ruta de almacenamiento no puede ser un directorio oculto de HDFS, como un directorio de instantáneas o papelera de reciclaje, o un directorio de sistema predeterminado, como /hbase o /user/hbase/backup.
- Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
- Cluster for Backup: Introduzca el nombre del clúster asignado al directorio de copia de respaldo.
- Target NameService Name: indica el nombre de NameService del directorio de copia de respaldo. El valor predeterminado es hacluster.
- RemoteHDFS: indica que los archivos de copia de respaldo se almacenan en el directorio de HDFS del clúster en espera.
Si selecciona esta opción, establezca los siguientes parámetros:
- Destination NameService Name: indica el nombre de NameService del clúster en espera. Puede establecerlo en el nombre de NameService (haclusterX, haclusterX1, haclusterX2, haclusterX3, o haclusterX4) del clúster remoto integrado del clúster, o el nombre de NameService de un clúster remoto configurado.
- IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
- Target NameNode IP Address: indica la dirección IP del plano de servicio NameNode en el clúster en espera. Puede ser de un nodo activo o en espera.
- Target Path: indica el directorio HDFS para almacenar los datos de copia de respaldo del clúster en espera. La ruta de almacenamiento no puede ser un directorio oculto de HDFS, como un directorio de instantáneas o papelera de reciclaje, o un directorio de sistema predeterminado, como /hbase o /user/hbase/backup.
- Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
- Source Cluster: Seleccione el clúster de la cola de Yarn utilizada por los datos de copia de respaldo.
- Queue Name: indica el nombre de la cola de Yarn utilizada para la ejecución de tareas de copia de respaldo. El nombre debe ser el mismo que el nombre de la cola que se está ejecutando correctamente en el clúster de origen.
- NFS: indica que los archivos de copia de respaldo se almacenan en el NAS mediante el protocolo NFS.
Si selecciona esta opción, establezca los siguientes parámetros:
- IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
- Server IP Address: indica la dirección IP del servidor NAS.
- Server Shared Path: indica el directorio compartido configurado del servidor NAS. (La ruta de acceso compartida del servidor no se puede establecer en el directorio raíz, y el grupo de usuarios y el grupo de propietarios de la ruta de acceso compartida deben ser nobody:nobody.)
- Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
- CIFS: indica que los archivos de copia de respaldo se almacenan en el NAS mediante el protocolo CIFS.
Si selecciona esta opción, establezca los siguientes parámetros:
- IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
- Server IP Address: indica la dirección IP del servidor NAS.
- Port: indica el número de puerto utilizado para conectarse al servidor NAS a través del protocolo CIFS. El valor predeterminado es 445.
- Username: indica el nombre de usuario establecido cuando se configura el protocolo CIFS.
- Password: indica la contraseña establecida cuando se configura el protocolo CIFS.
- Server Shared Path: indica el directorio compartido configurado del servidor NAS. (La ruta de acceso compartida del servidor no se puede establecer en el directorio raíz, y el grupo de usuarios y el grupo de propietarios de la ruta de acceso compartida deben ser nobody:nobody.)
- Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
- SFTP: indica que los archivos de copia de respaldo se almacenan en el servidor mediante el protocolo SFTP.
Si selecciona esta opción, establezca los siguientes parámetros:
- IP Mode: indica el modo de la dirección IP de destino. El sistema selecciona automáticamente el modo de dirección IP en función del tipo de red del clúster, por ejemplo IPv4 o IPv6.
- Server IP Address: indica la dirección IP del servidor donde se almacenan los datos de copia de respaldo.
- Port: indica el número de puerto utilizado para conectarse al servidor de copia de respaldo a través del protocolo SFTP. El valor predeterminado es 22.
- Username: indica el nombre de usuario para conectarse al servidor mediante el protocolo SFTP.
- Password: indica la contraseña para conectarse al servidor mediante el protocolo SFTP.
- Server Shared Path: indica la ruta de copia de respaldo en el servidor SFTP.
- Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
- OBS: indica que los archivos de copia de respaldo se almacenan en OBS.
Si selecciona esta opción, establezca los siguientes parámetros:
- Target Path: indica el directorio OBS para almacenar los datos de copia de respaldo.
- Maximum Number of Backup Copies: indica el número de conjuntos de archivos de copia de respaldo que se pueden retener en el directorio de copia de respaldo.
Solo MRS 3.1.0 o posterior admite la copia de respaldo de datos en OBS.
- LocalDir: indica que los archivos de copia de respaldo se almacenan en el disco local del nodo de gestión activo y el nodo de gestión en espera sincroniza automáticamente los archivos de copia de respaldo.
- Haga clic en OK.
- En la columna Operation de la tarea creada en la lista de tareas de copia de respaldo, haga clic en More y seleccione Back Up Now para ejecutar la tarea de copia de respaldo.
Después de ejecutar la tarea de copia de respaldo, el sistema crea automáticamente un subdirectorio para cada tarea de copia de respaldo en el directorio de copia de respaldo. El formato del nombre del subdirectorio es de Backup task name_Task creation time y el subdirectorio se utiliza para guardar los archivos de copia de respaldo de origen de datos.
El formato del nombre del archivo de copia de respaldo es Version_Data source_Task execution time.tar.gz.