ALM-14010 NameService es anormal (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el estado del servicio NameService cada 180 segundos. Esta alarma se genera cuando el servicio NameService no está disponible.
Esta alarma se borra cuando se recupera el servicio NameService.
Atributo
ID de alarma |
Gravedad de alarma |
Borrar automáticamente |
---|---|---|
14010 |
Grave |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
NSName |
Especifica el servicio NameService para el que se genera la alarma. |
Impacto en el sistema
HDFS no proporciona servicios para componentes de capa superior basados en el servicio NameService, como HBase y MapReduce. Como resultado, los usuarios no pueden leer ni escribir archivos.
Causas posibles
- El JournalNode es defectuosa.
- El DataNode está defectuoso.
- La capacidad del disco es insuficiente.
- El NameNode entra en modo seguro.
Procedimiento
- Compruebe el estado de la instancia de JournalNode.
- En la página de inicio del MRS Manager haga clic en Components.
- Haga clic en HDFS.
- Haga clic en Instance.
- Comprueba si el Health Status del JournalNode es Good.
- Seleccione el JournalNode defectuoso y elija More > Restart Instance. Compruebe si el JournalNode se reinicia correctamente.
- Espere 5 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 2.a.
- Compruebe el estado de la instancia de DataNode.
- En la página de detalles del clúster de MRS, haga clic en Components.
- Haga clic en HDFS.
- En el caso de Operation and Health Summary, compruebe si el Health Status de todos los DataNodes es Good.
- Haga clic en Instances. En la página de gestión del DataNode, seleccione el DataNode defectuoso y elija More > Restart Instance. Compruebe si el DataNode se reinicia correctamente.
- Espere 5 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 4.a.
- Verifique el estado del disco.
- En la página de detalles del clúster de MRS, haga clic en la pestaña Nodes y expanda un grupo de nodos.
- En la columna Disk Usage, compruebe si el espacio en disco es insuficiente.
- Amplíe la capacidad del disco.
- Espere 5 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 4.a.
- Compruebe si NameNode está en el modo seguro.
- Utilice el cliente en el nodo del clúster y ejecute el comando hdfs dfsadmin -safemode get para comprobar si se muestra Safe mode is ON.
La información detrás de Safe mode is ON es información de alarma y se muestra en función de las condiciones reales.
- Utilice el cliente en el nodo del clúster y ejecute el comando hdfs dfsadmin -safemode leave.
- Espere 5 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 5.
- Utilice el cliente en el nodo del clúster y ejecute el comando hdfs dfsadmin -safemode get para comprobar si se muestra Safe mode is ON.
- Recopilar información de fallas.
- En MRS Manager, seleccione .
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna