Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-14012 El JournalNode no está sincronizado

Descripción

En el NameNode activo, el sistema comprueba la consistencia de los datos de todos los JournalNodes del clúster cada 5 minutos. Esta alarma se genera cuando los datos en un JournalNode son inconsistentes con los datos en el otro JournalNodes.

Esta alarma se borra en 5 minutos después de que los datos de JournalNodes sean consistentes.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

14012

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

NameServiceName

Especifica el NameService para el que se genera la alarma.

Impacto en el sistema

Cuando un JournalNode está funcionando incorrectamente, los datos en el nodo se vuelven inconsistentes con los del otro JournalNodes. Si los datos de más de la mitad de JournalNodes son inconsistentes, el NameNode no puede funcionar correctamente, lo que hace que el servicio HDFS no esté disponible.

Causas posibles

  • La instancia JournalNode no existe (eliminada o migrada).
  • La instancia JournalNode no se ha iniciado o se ha detenido.
  • La instancia JournalNode funciona incorrectamente.
  • La red del JournalNode es inalcanzable.

Procedimiento

Comprobar si la instancia de JournalNode se ha iniciado.

  1. En el portal de FusionInsight Manager, seleccione O&M > Alarm > Alarms. En la lista de alarmas, haga clic en la alarma.
  2. Compruebe Location y obtenga la dirección IP del JournalNode para el que se genera la alarma.
  3. Elija Cluster > Name of the desired cluster > Services >HDFS >Instance. En la lista de instancias, compruebe si la instancia JournalNode existe en el nodo para el que se genera la alarma.

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 4.

  4. Elija O&M >Alarm >Alarms. En la lista de alarmas, haga clic en Clear en la columna Operation de la alarma. En el cuadro de diálogo que se muestra, haga clic en OK. No es necesario adoptar más medidas.
  5. Haga clic en la instancia JournalNode y compruebe si su Configuration Status es Synchronized.

    • En caso afirmativo, vaya a 8.
    • Si no, vaya a 6.

  6. Seleccione la instancia JournalNode y elija Start Instance para iniciar la instancia.
  7. Después de 5 minutos, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 15.

Comprobar si la instancia de JournalNode funciona correctamente.

  1. Comprueba si Running Status de la instancia JournalNode es Normal.

    • En caso afirmativo, vaya a 11.
    • Si no, vaya a 9.

  2. Seleccione la instancia JournalNode y elija More > Restart Instance para iniciar la instancia.
  3. Después de 5 minutos, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 15.

Comprobar si se puede acceder a la red de JournalNode.

  1. En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HDFS > Instance para comprobar la dirección IP del servicio del NameNode activo.
  2. Inicie sesión en el NameNode activo como usuario root.
  3. Ejecute el comando ping para comprobar si se produce un tiempo de espera o si la red es inalcanzable entre el NameNode activo y el JournalNode.

    ping service IP address of the JournalNode

    • En caso afirmativo, vaya a 14.
    • Si no, vaya a 15.

  4. Póngase en contacto con el administrador de la red para rectificar la falla de la red y comprobar si la alarma se borra 5 minutos después.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 15.

Recopilar información de fallas.

  1. En el portal del FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione HDFS en el clúster requerido en el Service.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 30 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna