ALM-23001 Servicio de Loader no disponible
Descripción
El sistema comprueba la disponibilidad del servicio del Loader cada 60 segundos. Esta alarma se genera cuando el sistema detecta que el servicio Loader no está disponible. Esta alarma se borra cuando el servicio del Loader está disponible.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
23001 |
Crítica |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
Cuando el servicio Loader no está disponible, las funciones de carga, importación y conversión de datos no están disponibles.
Causas posibles
- El servicio interno del que depende el servicio del Loader es anormal.
- El servicio ZooKeeper es anormal.
- El servicio HDFS es anormal.
- El servicio DBService es anormal.
- El servicio Yarn es anormal.
- El servicio Mapreduce es anormal.
- Falla del entorno: La red es anormal, por lo que el servicio Loader no puede comunicarse con los servicios internos dependientes y no puede proporcionar servicios.
- Falla del software: El servicio Loader no puede ejecutarse correctamente.
Procedimiento
Verificar el estado del servicio de ZooKeeper.
- En la página de inicio del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > ZooKeeper para comprobar si el estado de ejecución del ZooKeeper es Normal.
- Elija More > Restart Service para reiniciar el servicio ZooKeeper. En la lista de alarmas, compruebe si LoaderService no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 3.
- En el FusionInsight Manager, compruebe si la lista de alarmas contiene Process Fault.
- En el área Location de Process Fault, compruebe si ServiceName es ZooKeeper.
- Rectifique la falla siguiendo los pasos indicados en ALM-12007 Falla de proceso.
- En la lista de alarmas, compruebe si Servicio Loader no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 7.
Comprobar el estado de servicio HDFS.
- En el FusionInsight Manager, compruebe si la lista de alarmas contiene HDFS Service Unavailable.
- Rectifique la falla siguiendo los pasos indicados en ALM-14000 Servicio HDFS no disponible.
- En la lista de alarmas, compruebe si Servicio Loader no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 10.
Comprobar el estado de DBService.
- En la página principal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > DBService para comprobar si el estado de ejecución de DBService es de Normal.
- Elija More > Restart Service para reiniciar el servicio DBService. En la lista de alarmas, compruebe si LoaderService no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 12.
Comprobar el estado de Mapreduce.
- En la página principal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Mapreduce para comprobar si el estado de ejecución de Mapreduce es de Normal.
- Elija More > Restart Service para reiniciar el servicio Mapreduce. En la lista de alarmas, compruebe si LoaderService no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 16.
Comprobar el estado de Yarn.
- En la página de inicio del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Yarn para comprobar si el estado de ejecución del Yarn es de Normal.
- Elija More > Restart Service para reiniciar el servicio de Yarn. En la lista de alarmas, compruebe si LoaderService no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 16.
- En el FusionInsight Manager, compruebe si la lista de alarmas contiene Servicio Yarn no disponible.
- Rectifique la falla siguiendo los pasos indicados en ALM-18000 Servicio Yarn no disponible.
- En la lista de alarmas, compruebe si Servicio Loader no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 19.
Comprobar la conexión de red entre Loader y los componentes dependientes.
- En el FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Loader.
- Haga clic en Instance y aparecerá la lista de instancias LoaderServer.
- Registra el Management IP Address en la fila de LoaderServer(Active).
- Inicie sesión en el host donde se ejecuta el LoaderServer activo como usuario omm usando la dirección IP obtenida en 21.
- Ejecute el comando ping para comprobar si la comunicación entre el host que ejecuta el LoaderServer activo y los hosts que ejecutan los componentes dependientes. (Los componentes dependientes incluyen ZooKeeper, DBService, HDFS, Mapreduce y Yarn. Obtenga las direcciones IP de los hosts que ejecutan estos servicios de la misma manera que para obtener la dirección IP del LoaderServer activo.)
- Póngase en contacto con el administrador para restaurar la red.
- En la lista de alarmas, compruebe si Servicio Loader no disponible está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 26.
Recopilar información de fallas.
- En el FusionInsight Manager, elija O&M > Log > Download.
- Seleccione los siguientes nodos en el clúster requerido en la lista desplegable Service:
- ZooKeeper
- HDFS
- DBService
- Yarn
- Mapreduce
- Loader
- Haga clic en
en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- En el FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Loader.
- Elija More > Restart Service y haga clic en OK.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 32.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna