Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-26051 Servicio de Storm no disponible

Descripción

El sistema comprueba el estado del servicio de Storm cada 30 segundos. Esta alarma se genera cuando todos los nodos Nimbus del clúster son anormales y el servicio Storm no está disponible.

Esta alarma se borra cuando el servicio Storm se recupera.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

26051

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

El clúster no puede proporcionar el servicio Storm y los usuarios no pueden realizar nuevas tareas de Storm.

Causas posibles

  • El clúster de Kerberos es defectuoso.
  • El clúster ZooKeeper es defectuoso o está suspendido.
  • Los nodos Nimbus activos y en espera en el clúster Storm son anormales

Procedimiento

Comprobar el estado del clúster de Kerberos. (Omita este paso si se usa el modo normal).

  1. En el portal del administrador de FusionInsight, elija Cluster > Name of the desired cluster > Services.
  2. Compruebe si el estado de ejecución del servicio Kerberos es de Normal.

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 3.

  3. Consulte la información de mantenimiento relacionada de ALM-25500 Servicio KrbServer no disponible.
  4. Verifique si la alarma se ha borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 5.

Verificar el estado del clúster de ZooKeeper.

  1. Compruebe si el estado de ejecución del servicio ZooKeeper es de tipo Normal.

    • En caso afirmativo, vaya a 8.
    • Si no, vaya a 6.

  2. Si se detiene el servicio ZooKeeper, inícielo, de lo contrario vea la información de mantenimiento relacionada de ALM-13000 Servicio ZooKeeper no disponible.
  3. Verifique si la alarma se ha borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 8.

Comprobar el estado de los nodos Nimbus activos y en espera.

  1. Seleccione Cluster > Name of the desired cluster > Services > Storm > Nimbus para ir a la página Instancias de Nimbus.
  2. Comprueba si solo un nodo Nimbus está en estado Active en Roles.

    • En caso afirmativo, vaya a 13.
    • Si no, vaya a 10.

  3. Seleccione dos instancias de rol Nimbus, elija More > Restart Instance y compruebe si las instancias se reinician correctamente.

    • En caso afirmativo, vaya a 11.
    • Si no, vaya a 13.

  4. Inicie sesión de nuevo en el portal del administrador de FusionInsight y seleccione Cluster > Name of the desired cluster > Services > Storm > Nimbus para comprobar si el estado de ejecución es Normal.

    • En caso afirmativo, vaya a 12.
    • Si no, vaya a 13.

  5. Espere 30 segundos y compruebe si la alarma está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 13.

Recopilación de información de error

  1. En el FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione los siguientes nodos en el clúster requerido en la lista desplegable Service:

    • KrbServer

      Los registros de KrbServer no necesitan descargarse en modo normal.

    • ZooKeeper
    • Storm

  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna