Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

Desmantelar y volver a poner en servicio una instancia

Escenario

Algunas instancias de rol proporcionan servicios para servicios externos en modo distribuido y paralelo. Los servicios almacenan de forma independiente información sobre si se puede utilizar cada instancia. Por lo tanto, debe usar FusionInsight Manager para volver a poner en marcha o desmantelar estas instancias para cambiar el estado de ejecución de la instancia.

En algunos casos no se admiten las funciones de reinicio y desmantelamiento.

Las siguientes funciones admiten el retiro y la puesta en marcha: HDFS DataNode, YARN NodeManager, y HBase RegionServer.
  • Si el número del DataNodes es menor o igual que el de las réplicas HDFS, no se puede realizar el desmantelamiento. Si el número de réplicas HDFS es tres y el número de DataNodes es inferior a cuatro en el sistema, no se puede realizar el desmantelamiento. En este caso, se informará de un error y obligará al FusionInsight Manager a salir del desmantelamiento 30 minutos después de que el FusionInsight Manager intente realizar el desmantelamiento.
  • Durante la ejecución de tareas de MapReduce, se generan archivos con 10 réplicas. Por lo tanto, si el número de instancias de DataNode es inferior a 10, no se puede realizar el desmantelamiento.
  • Si el número de racks de DataNode (el número de racks está determinado por el número de racks configurados para cada DataNode) es mayor que 1 antes de la retirada del servicio, y después de que algunos DataNodes sean retirados del servicio, el de los DataNodes restantes cambia a 1, la retirada del servicio fallará. Por lo tanto, antes de retirar las instancias de DataNode, debe evaluar el impacto de la retirada en el número de racks para ajustar el DataNodes que se va a retirar.
  • Si se retiran varios DataNodes al mismo tiempo, y cada uno de ellos almacena un gran volumen de datos, es posible que el DataNodes no se retire debido al tiempo de espera. Para evitar este problema, se recomienda desmantelar un DataNode cada vez y realizar múltiples operaciones de desmantelar.

Procedimiento

  1. Realice los siguientes pasos para realizar una comprobación de estado del DataNodes antes de retirar el servicio:

    1. Inicie sesión en el nodo de instalación del cliente como usuario de cliente y cambie al directorio de instalación del cliente.
    2. Para un clúster de seguridad, utilice el hdfs de usuario para la autenticación de permisos.
      source bigdata_env               #Configure client environment variables.
      kinit hdfs                       #Configure kinit authentication.
      Password for hdfs@HADOOP.COM:    #Enter the login password of user hdfs.
    3. Ejecute el comando hdfs fsck / -list-corruptfileblocks y compruebe el resultado devuelto.
      • Si aparece "has 0 CORRUPT files", vaya a 2.
      • Si el resultado no contiene "has 0 CORRUPT files" y se devuelve el nombre del archivo dañado, vaya a 1.d.
    4. Ejecute el comando hdfs dfs -rm Name of the damaged file para eliminar el archivo dañado.

  2. Inicie sesión en FusionInsight Manager.
  3. Elija Cluster >Name of the desired cluster >Services.
  4. Haga clic en el nombre del servicio especificado en la página de gestión de servicios. En la página mostrada, haga clic en la pestaña Instance.
  5. Seleccione la instancia de rol especificada que se va a retirar del servicio.
  6. Seleccione Decommission o Recommission en la lista desplegable More.

    En el cuadro de diálogo que se muestra, introduzca la contraseña del usuario de inicio de sesión actual y haga clic en OK.

    Seleccione I confirm to decommission these instances and accept the consequence of service performance deterioration y haga clic en OK para realizar la operación correspondiente.

    Durante la retirada de la instancia, si el servicio correspondiente a la instancia se reinicia en el clúster mediante otro navegador, FusionInsight Manager muestra un mensaje que indica que la retirada de la instancia se ha detenido, pero el estado operativo de la instancia se muestra como Started. En este caso, la instancia ha sido desmantelada en segundo plano. Para sincronizar el estado operativo, debe volver a desmantelar la instancia.