Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-14012 El JournalNode no está sincronizado

Actualización más reciente 2023-11-20 GMT+08:00

Ver PDF

ALM-14012 El JournalNode no está sincronizado

Descripción

En el NameNode activo, el sistema comprueba la consistencia de los datos de todos los JournalNodes del clúster cada 5 minutos. Esta alarma se genera cuando los datos en un JournalNode son inconsistentes con los datos en el otro JournalNodes.

Esta alarma se borra en 5 minutos después de que los datos de JournalNodes sean consistentes.

Atributo

ID de alarma	Gravedad de la alarma	Borrado automáticamente
14012	Importante	Sí

Parámetros

Nombre	Significado
Source	Especifica el clúster para el que se genera la alarma.
ServiceName	Especifica el servicio para el que se genera la alarma.
RoleName	Especifica el rol para el que se genera la alarma.
HostName	Especifica el host para el que se genera la alarma.
NameServiceName	Especifica el NameService para el que se genera la alarma.

Impacto en el sistema

Cuando un JournalNode está funcionando incorrectamente, los datos en el nodo se vuelven inconsistentes con los del otro JournalNodes. Si los datos de más de la mitad de JournalNodes son inconsistentes, el NameNode no puede funcionar correctamente, lo que hace que el servicio HDFS no esté disponible.

Causas posibles

La instancia JournalNode no existe (eliminada o migrada).
La instancia JournalNode no se ha iniciado o se ha detenido.
La instancia JournalNode funciona incorrectamente.
La red del JournalNode es inalcanzable.

Procedimiento

Comprobar si la instancia de JournalNode se ha iniciado.

En el portal de FusionInsight Manager, seleccione O&M > Alarm > Alarms. En la lista de alarmas, haga clic en la alarma.
Compruebe Location y obtenga la dirección IP del JournalNode para el que se genera la alarma.
Elija Cluster > Name of the desired cluster > Services >HDFS >Instance. En la lista de instancias, compruebe si la instancia JournalNode existe en el nodo para el que se genera la alarma.
- En caso afirmativo, vaya a 5.
- Si no, vaya a 4.
Elija O&M >Alarm >Alarms. En la lista de alarmas, haga clic en Clear en la columna Operation de la alarma. En el cuadro de diálogo que se muestra, haga clic en OK. No es necesario adoptar más medidas.
Haga clic en la instancia JournalNode y compruebe si su Configuration Status es Synchronized.
- En caso afirmativo, vaya a 8.
- Si no, vaya a 6.
Seleccione la instancia JournalNode y elija Start Instance para iniciar la instancia.
Después de 5 minutos, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 15.

Comprobar si la instancia de JournalNode funciona correctamente.

Comprueba si Running Status de la instancia JournalNode es Normal.
- En caso afirmativo, vaya a 11.
- Si no, vaya a 9.
Seleccione la instancia JournalNode y elija More > Restart Instance para iniciar la instancia.
Después de 5 minutos, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 15.

Comprobar si se puede acceder a la red de JournalNode.

En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HDFS > Instance para comprobar la dirección IP del servicio del NameNode activo.
Inicie sesión en el NameNode activo como usuario root.
Ejecute el comando ping para comprobar si se produce un tiempo de espera o si la red es inalcanzable entre el NameNode activo y el JournalNode.

ping service IP address of the JournalNode
- En caso afirmativo, vaya a 14.
- Si no, vaya a 15.
Póngase en contacto con el administrador de la red para rectificar la falla de la red y comprobar si la alarma se borra 5 minutos después.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 15.

Recopilar información de fallas.

En el portal del FusionInsight Manager, elija O&M > Log > Download.
Seleccione HDFS en el clúster requerido en el Service.
Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 30 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
Póngase en contacto con el y envíe los registros recopilados.