Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-14000 Servicio HDFS no disponible

Descripción

El sistema comprueba el estado del servicio NameService cada 60 segundos. Esta alarma se genera cuando todos los servicios de NameService son anormales y el sistema considera que el servicio HDFS no está disponible.

Esta alarma se borra cuando al menos un servicio NameService es normal y el sistema considera que el servicio HDFS se recupera.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

14000

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

HDFS no proporciona servicios para componentes de capa superior basados en servicios HDFS, como HBase y MapReduce. Como resultado, los usuarios no pueden leer ni escribir archivos.

Causas posibles

  • El servicio ZooKeeper es anormal.
  • Todos los servicios de NameService son anormales.

Procedimiento

Verificar el estado del servicio de ZooKeeper.

  1. En el portal del FusionInsight Manager, seleccione O&M > Alarm > Alarms. En la página Alarma, compruebe si se ha informado de ALM-13000 Servicio ZooKeeper no disponible.

    • En caso afirmativo, vaya a 2.
    • Si no, vaya a 4.

  2. Consulte ALM-13000 Servicio ZooKeeper no disponible para corregir el estado de salud de la falla de ZooKeeper y comprueba si el Running Status del servicio ZooKeeper se restaura a Normal.

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 7.

  3. En la página O&M > Alarm > Alarms, compruebe si la alarma está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 4.

Manejar la alarma de excepción del servicio NameService.

  1. En el portal del FusionInsight Manager, seleccione O&M > Alarm > Alarms. En la página Alarmas, compruebe si se ha informado de ALM-14010 Servicio NameService no disponible.

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 7.

  2. Vea ALM-14010 Servicio NameService no disponible para controlar los servicios anormales de NameService y compruebe si cada alarma de excepción de servicio de NameService está desactivada.

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 7.

  3. En la página O&M > Alarm > Alarms, compruebe si la alarma está desactivada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 7.

Recopilar información de fallas.

  1. En el portal del FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione los siguientes nodos en el clúster requerido desde el Service:

    • ZooKeeper
    • HDFS

  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna