ALM-18021 El servicio Mapreduce no está disponible
Descripción
El módulo de alarma comprueba el estado del servicio MapReduce cada 60 segundos. Esta alarma se genera cuando el sistema detecta que el servicio MapReduce no está disponible.
La alarma se borra cuando se recupera el servicio MapReduce.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
18021 |
Crítica |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El clúster no puede proporcionar el servicio MapReduce. Por ejemplo, no se puede utilizar MapReduce para ver los registros de tareas o la función de archivo de registros no está disponible.
Causas posibles
- La instancia JobHistoryServer es anormal.
- El servicio KrbServer es anormal.
- El servicio ZooKeeper es anormal.
- El servicio HDFS anormal.
- El servicio Yarn es anormal.
Procedimiento
Comprobar el estado de instancia JobHistoryServer de servicio MapReduce.
- En la página principal del Administrador FusionInsight, elija Cluster > Name of the desired cluster > Services > MapReduce > Instance.
- Comprueba si el estado de ejecución de JobHistoryServer es de tipo Normal.
Comprobar el estado de servicio KrbServer.
- En la lista de alarmas del FusionInsight Manager, compruebe si existe ALM-25500 Servicio KrbServer no disponible.
- Rectifique la falla siguiendo los pasos de ALM-25500 Servicio KrbServer no disponible y compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 5.
Comprobar el servicio ZooKeeper.
- En la lista de alarmas del FusionInsight Manager, compruebe si existe ALM-13000 Servicio ZooKeeper Service no disponible.
- Rectifique la falla siguiendo los pasos en ALM-13000 Servicio ZooKeeper Service no disponible y compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 7.
Comprobar el estado de servicio HDFS.
- En la lista de alarmas del Administrador de FusionInsight, compruebe si existe ALM-14000 Servicio HDFS no disponible.
- Rectifique el fallo siguiendo los pasos en ALM-14000 Servicio HDFS no disponible y compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 9.
Comprobar el estado de servicio Yarn.
- En la lista de alarmas del FusionInsight Manager, compruebe si existe ALM-18000 Servicio Yarn no disponible.
- Rectifique la falla siguiendo los pasos en ALM-18000 Servicio Yarn no disponible y compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 11.
Recopilar información de fallas.
- En la página de inicio del FusionInsight Manager del clúster activo, elija O&M Log > Download.
- Seleccione MapReduce en el clúster requerido en Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna