ALM-26051 Servicio de Storm no disponible
Descripción
El sistema comprueba el estado del servicio de Storm cada 30 segundos. Esta alarma se genera cuando todos los nodos Nimbus del clúster son anormales y el servicio Storm no está disponible.
Esta alarma se borra cuando el servicio Storm se recupera.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
26051 |
Crítica |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El clúster no puede proporcionar el servicio Storm y los usuarios no pueden realizar nuevas tareas de Storm.
Causas posibles
- El clúster de Kerberos es defectuoso.
- El clúster ZooKeeper es defectuoso o está suspendido.
- Los nodos Nimbus activos y en espera en el clúster Storm son anormales
Procedimiento
Comprobar el estado del clúster de Kerberos. (Omita este paso si se usa el modo normal).
- En el portal del administrador de FusionInsight, elija Cluster > Name of the desired cluster > Services.
- Compruebe si el estado de ejecución del servicio Kerberos es de Normal.
- Consulte la información de mantenimiento relacionada de ALM-25500 Servicio KrbServer no disponible.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 5.
Verificar el estado del clúster de ZooKeeper.
- Compruebe si el estado de ejecución del servicio ZooKeeper es de tipo Normal.
- Si se detiene el servicio ZooKeeper, inícielo, de lo contrario vea la información de mantenimiento relacionada de ALM-13000 Servicio ZooKeeper no disponible.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 8.
Comprobar el estado de los nodos Nimbus activos y en espera.
- Seleccione Cluster > Name of the desired cluster > Services > Storm > Nimbus para ir a la página Instancias de Nimbus.
- Comprueba si solo un nodo Nimbus está en estado Active en Roles.
- Seleccione dos instancias de rol Nimbus, elija More > Restart Instance y compruebe si las instancias se reinician correctamente.
- Inicie sesión de nuevo en el portal del administrador de FusionInsight y seleccione Cluster > Name of the desired cluster > Services > Storm > Nimbus para comprobar si el estado de ejecución es Normal.
- Espere 30 segundos y compruebe si la alarma está desactivada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 13.
Recopilación de información de error
- En el FusionInsight Manager, elija O&M > Log > Download.
- Seleccione los siguientes nodos en el clúster requerido en la lista desplegable Service:
- KrbServer
Los registros de KrbServer no necesitan descargarse en modo normal.
- ZooKeeper
- Storm
- KrbServer
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna