Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

Habilitación de la replicación entre clústeres

Escenario

DistCp se utiliza para replicar los datos almacenados en HDFS desde un clúster a otro clúster. DistCp depende de la función de replicación entre clústeres, que está deshabilitada de forma predeterminada. Necesita habilitarlo para ambos clústeres.

Esta sección describe cómo modificar parámetros en FusionInsight Manager para habilitar la función de replicación entre clústeres. Una vez habilitada esta función, puede crear una tarea de copia de respaldo para realizar copias de respaldo de los datos en el HDFS remoto (RemoteHDFS).

Impacto en el sistema

Yarn necesita reiniciarse para habilitar la función de replicación entre clústeres y no se puede acceder durante el reinicio.

Prerrequisitos

  • El parámetro hadoop.rpc.protection de HDFS en los dos clústeres para la replicación de datos debe utilizar el mismo modo de transmisión de datos. El valor predeterminado es privacy, que indica la transmisión cifrada. El valor authentication indica que la transmisión no está cifrada.
  • Para los clústeres en modo de seguridad, debe configurar la confianza mutua entre clústeres.

Procedimiento

  1. Inicie sesión en FusionInsight Manager de uno de los dos clústeres.
  2. Elija Cluster > Name of the desired cluster > Services > Yarn > Configurations y haga clic en All Configurations.
  3. En el panel de navegación, elija Yarn >Distcp.
  4. Modifique dfs.NameNode.rpc-address y establezca haclusterX.remotenn1 en la dirección IP del servicio y el puerto RPC de una instancia de NameNode del clúster de pares, y establezca haclusterX.remotenn2 en la dirección IP del servicio y el número de puerto RPC de la otra instancia de NameNode del clúster de pares.

    haclusterX.remotenn1 y haclusterX.remotenn2 no distinguen las NameNodes activas y en espera. El puerto RPC de NameNode predeterminado es 8020 y no se puede modificar en Manager.

    Ejemplos de valores de parámetros modificados: 10.1.1.1:8020 y 10.1.1.2:8020.

    • Si los datos del clúster actual necesitan ser respaldados en el HDFS de varios clústeres, puede configurar las direcciones RPC de NameNode correspondientes en haclusterX1, haclusterX2, haclusterX3 y haclusterX4.

  5. Haga clic en Save. En el cuadro de diálogo de confirmación, haga clic en OK.
  6. Reinicie el servicio Yarn.
  7. Inicie sesión en FusionInsight Manager del otro clúster y repita 2 a 6.