ALM-43001 Servicio Spark2x no disponible
Descripción
El sistema comprueba el estado del servicio Spark2x cada 300 segundos. Esta alarma se genera cuando el servicio Spark2x no está disponible.
Esta alarma se borra cuando se recupera el servicio Spark2x.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
43001 |
Crítica |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
Las tareas de Spark enviadas por los usuarios no se pueden ejecutar.
Causas posibles
- El servicio KrbServer es anormal.
- El servicio LdapServer es anormal.
- ZooKeeper es anormal.
- HDFS es anormal.
- Yarn es anormal.
- El servicio Hive correspondiente es anormal.
- El paquete de ensamblaje de Spark2x es anormal.
Procedimiento
Si la alarma es un paquete de ensamblaje de Spark2x anormal, el paquete Spark es anormal. Espera unos 10 minutos. La alarma se borra automáticamente.
Comprobar si existen alarmas de indisponibilidad del servicio en los servicios de los que depende.
- En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms.
- Compruebe si existen las siguientes alarmas en la lista de alarmas:
- ALM-25500 Servicio KrbServer no disponible
- ALM-25000 Servicio LdapServer no disponible
- ALM-13000 Servicio ZooKeeper no disponible
- ALM-14000 Servicio HDFS no disponible
- ALM-18000 Servicio de Yarn no disponible
- ALM-16004 Servicio Hive no disponible
- Manejar las alarmas basándose en los métodos de solución de problemas proporcionados en la ayuda de alarma.
Después de que se desactive la alarma, espere unos minutos y compruebe si la alarma GuardianService no disponible está despejado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 4.
Recopilar información de fallas.
- En FusionInsight Manager, elija O&M > Log > Download.
- En el área Service, seleccione los siguientes nodos del clúster deseado. (Hive es el servicio específico de Hive determinado basado en el ServiceName en la información de ubicación de la alarma).
- KrbServer
- LdapServer
- ZooKeeper
- HDFS
- Yarn
- Hive
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con y proporcione los registros recopilados.
Eliminación de alarmas
Esta alarma se borra automáticamente después de rectificar la falla.
Información relacionada
Ninguna