Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-16004 Servicio Hive no disponible

Descripción

Esta alarma se genera cuando el servicio HiveServer no está disponible. El sistema comprueba el estado del servicio HiveServer cada 60 segundos.

Esta alarma se borra cuando el servicio HiveServer es normal.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

16004

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

El sistema no puede proporcionar servicios de carga, consulta y extracción de datos.

Causas posibles

  • La falta de disponibilidad del servicio Hive puede estar relacionada con las fallas del proceso Hive, así como con servicios básicos, como ZooKeeper y el sistema de archivos distribuidos de Hadoop (HDFS), Yarn y DBService.
    • El servicio ZooKeeper es anormal.
    • El servicio HDFS es anormal.
    • El servicio Yarn es anormal.
    • El servicio DBService es anormal.
    • El proceso de servicio de Hive es anormal. Si la alarma es causada por una falla del proceso de Hive, el informe de alarma tiene un retraso de aproximadamente 5 minutos.
  • La comunicación de red entre Hive y los servicios básicos se interrumpe.

Procedimiento

Comprobar el estado de proceso de HiveServer/MetaStore.

  1. En el portal de FusionInsight Manager, haga clic en Cluster > Name of the desired cluster > Services > Hive > Instance. En la lista de instancias de Hive, compruebe si las instancias HiveServer o MetaStore están en el estado Unknown.

    • En caso afirmativo, vaya a 2.
    • Si no, vaya a 4.

  2. En la lista de instancias de Hive, elija More > Restart Instance para reiniciar el proceso HiveServer/MetaStore.
  3. En la lista de alarmas, compruebe si Hive Service Unavailable está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 4.

Verificar el estado del servicio de ZooKeeper.

  1. En el FusionInsight Manager, compruebe si la lista de alarmas contiene Process Fault.

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 8.

  2. En el Process Fault, compruebe si ServiceName tiene un valor de tipo ZooKeeper.

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 8.

  3. Rectifique la falla siguiendo los pasos proporcionados en "ALM-12007 Falla de proceso".
  4. En la lista de alarmas, compruebe si Hive Service Unavailable está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 8.

Comprobar el estado de servicio HDFS.

  1. En el FusionInsight Manager, compruebe si la lista de alarmas contiene HDFS Service Unavailable.

    • En caso afirmativo, vaya a 9.
    • Si no, vaya a 11.

  2. Rectifique el falla siguiendo los pasos proporcionados en "ALM-14000 Servicio HDFS no disponible".
  3. En la lista de alarmas, compruebe si Hive Service Unavailable está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 11.

Comprobar el estado de servicio Yarn.

  1. En la lista de alarmas del FusionInsight Manager, compruebe si se ha generado Servicio Yarn no disponible.

    • En caso afirmativo, vaya a 12.
    • Si no, vaya a 14.

  2. Rectifique la falla. Para obtener más información, consulte "ALM-18000 Servicio Yarn no disponible".
  3. En la lista de alarmas, compruebe si Hive Service Unavailable está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 14.

Comprobar el estado del servicio DBService.

  1. En la lista de alarmas del FusionInsight Manager, compruebe si se ha generado Servicio DBService no disponible.

    • En caso afirmativo, vaya a 15.
    • Si no, vaya a 17.

  2. Rectifique la falla. Para obtener más información, consulte "ALM-27001 Servicio DBService no disponible".
  3. En la lista de alarmas, compruebe si Hive Service Unavailable está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 17.

Compruebe la conexión de red entre Hive y ZooKeeper, HDFS, Yarn y DBService.

  1. En el FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Hive.
  2. Haga clic en Instance.

    Se muestra la lista de instancias HiveServer.

  3. Haga clic en Host Name en la fila de HiveServer.

    Se muestra la página de estado del host HiveServer activo.

  4. Registre la dirección IP en Basic Information.
  5. Utilice la dirección IP obtenida en 20 para iniciar sesión en el host donde se ejecuta el HiveServer activo como usuario omm.
  1. Ejecute el comando ping para comprobar si la comunicación entre el host que ejecuta el HiveServer activo y los hosts que ejecutan los servicios ZooKeeper, HDFS, Yarn, y DBService es normal. (Obtenga las direcciones IP de los hosts que ejecutan los servicios ZooKeeper, HDFS, Yarn y DBService de la misma manera que para obtener la dirección IP del HiveServer activo.)

    • En caso afirmativo, vaya a 25.
    • Si no, vaya a 23.

  2. Póngase en contacto con el administrador para restaurar la red.
  3. En la lista de alarmas, compruebe si Hive Service Unavailable está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 25.

Recopilar información de fallas.

  1. En el FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione los siguientes nodos en el clúster requerido desde el Service:

    • ZooKeeper
    • HDFS
    • Yarn
    • DBService
    • Hive

  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna