Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-45000 Servicio HetuEngine no disponible

Descripción

El sistema comprueba el estado del servicio cada 300 segundos. Esta alarma se genera cuando el servicio no está disponible.

Esta alarma se borra cuando se recupera el servicio .

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

45000

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

Las tareas de no se pueden ejecutar.

Causas posibles

  • El servicio KrbServer es anormal.
  • El servicio ZooKeeper es anormal.
  • El servicio HDFS es anormal.
  • El servicio Yarn es anormal.
  • El servicio DBService es anormal.
  • El servicio Hive es anormal.
  • No hay instancias de HSBroker en .

Procedimiento

Comprobar el estado de servicio KrbServer.

  1. En FusionInsight Manager, seleccione O&M > Alarm > Alarm.
  2. En la lista de alarmas, compruebe si se genera la alarma "ALM-25500 Servicio KrbServer no disponible".

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 5.

  3. Borre "ALM-25500 Servicio KrbServer no disponible" de acuerdo con la ayuda de alarma.
  4. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 5.

Verificar el estado del servicio de ZooKeeper.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-12007 Falla de proceso".

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 9.

  2. En la lista de alarmas, haga clic en en la fila que contiene la alarma "Falla de proceso". Compruebe si el nombre del servicio para el que se genera la alarma es ZooKeeper en Location Information.

    • En caso afirmativo, vaya a 7.
    • Si no, vaya a 9.

  3. Borre "ALM-12007 Falla de proceso" de acuerdo con la ayuda de alarma.
  4. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 9.

Comprobar el estado de servicio HDFS.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-14000 Servicio HDFS no disponible."

    • En caso afirmativo, vaya a 10.
    • Si no, vaya a 12.

  2. Borre "ALM-14000 Servicio HDFS no disponible" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 12.

Comprobar el estado de servicio YARN.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-18000 Servicio YARN no disponible".

    • En caso afirmativo, vaya a 13.
    • Si no, vaya a 15.

  2. Borre "ALM-18000 Servicio YARN no disponible" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 15.

Comprobar el estado del servicio DBService.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-27001 Servicio DBService no disponible".

    • En caso afirmativo, vaya a 16.
    • Si no, vaya a 20.

  2. Borre "ALM-27001 Servicio DBService no disponible" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 20.

Comprobar el estado de servicio Hive.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-16004 Servicio Hive no disponible".

    • En caso afirmativo, vaya a 19.
    • Si no, vaya a 20.

  2. Borre "ALM-16004 Servicio Hive no disponible" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 20.

Comprobar si no hay instancias de HSBroker en .

  1. En FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > . En la página que se muestra, haga clic en la pestaña Instance.
  2. Compruebe si no hay instancias de HSBroker.

    • Si es así, haga clic en Add Instance para agregar uno.
    • Si no, vaya a 23.

  3. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 23.

Comprobar la conexión de red entre y ZooKeeper, HDFS, YARN, DBService y Hive.

  1. En FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > . En la página que se muestra, haga clic en la pestaña Instance.
  2. Haga clic en el nombre de host en la fila HSBroker y registre la dirección IP de gestión en el área Basic Information.
  3. Inicie sesión en el host donde reside HSBroker como usuario omm usando la dirección IP obtenida en 25.
  1. Ejecute el comando ping para comprobar si la conexión de red entre el host donde reside HSBroker y los hosts donde residen ZooKeeper y HDFS, Yarn, DBService y Hive está en el estado normal.

    • En caso afirmativo, vaya a 30.
    • Si no, vaya a 28.

  2. Póngase en contacto con el administrador de red para restaurar la red.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45000 Servicio no disponible" está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 30.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. Expanda la lista desplegable Service. En el cuadro de diálogo Services que se muestra, seleccione en el nombre del clúster de destino y haga clic en OK.
  3. Expanda la lista desplegable Hosts. En el cuadro de diálogo Select Host que se muestra, seleccione los hosts a los que pertenece el rol y haga clic en OK.
  4. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 30 minutos antes y después del tiempo de generación de alarmas respectivamente. A continuación, haga clic en Download.
  5. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Referencia

Ninguna