Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-43001 Servicio Spark2x no disponible

Descripción

El sistema comprueba el estado del servicio Spark2x cada 300 segundos. Esta alarma se genera cuando el servicio Spark2x no está disponible.

Esta alarma se borra cuando se recupera el servicio Spark2x.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

43001

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

Las tareas de Spark enviadas por los usuarios no se pueden ejecutar.

Causas posibles

  • El servicio KrbServer es anormal.
  • El servicio LdapServer es anormal.
  • ZooKeeper es anormal.
  • HDFS es anormal.
  • Yarn es anormal.
  • El servicio Hive correspondiente es anormal.
  • El paquete de ensamblaje de Spark2x es anormal.

Procedimiento

Si la alarma es un paquete de ensamblaje de Spark2x anormal, el paquete Spark es anormal. Espera unos 10 minutos. La alarma se borra automáticamente.

Comprobar si existen alarmas de indisponibilidad del servicio en los servicios de los que depende.

  1. En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms.
  2. Compruebe si existen las siguientes alarmas en la lista de alarmas:

    • ALM-25500 Servicio KrbServer no disponible
    • ALM-25000 Servicio LdapServer no disponible
    • ALM-13000 Servicio ZooKeeper no disponible
    • ALM-14000 Servicio HDFS no disponible
    • ALM-18000 Servicio de Yarn no disponible
    • ALM-16004 Servicio Hive no disponible
    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 4.

  3. Manejar las alarmas basándose en los métodos de solución de problemas proporcionados en la ayuda de alarma.

    Después de que se desactive la alarma, espere unos minutos y compruebe si la alarma GuardianService no disponible está despejado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 4.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. En el área Service, seleccione los siguientes nodos del clúster deseado. (Hive es el servicio específico de Hive determinado basado en el ServiceName en la información de ubicación de la alarma).

    • KrbServer
    • LdapServer
    • ZooKeeper
    • HDFS
    • Yarn
    • Hive

  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna