Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-12007 Falla de proceso

Descripción

Esta alarma se genera cuando el módulo de comprobación de estado de proceso detecta que el estado de conexión de proceso es Bad tres veces consecutivas. El módulo de comprobación de estado del proceso comprueba el estado del proceso cada 5 segundos.

Esta alarma se borra cuando se puede conectar el proceso.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

12007

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster o sistema para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

El servicio proporcionado por el proceso no está disponible.

Causas posibles

  • El proceso de instancia es anormal.
  • El espacio del disco no es suficiente.

Si existe un gran número de alarmas de falla de proceso en un segmento de tiempo, los archivos en el directorio de instalación pueden borrarse por error o el permiso en el directorio puede modificarse.

Procedimiento

Comprobar si el proceso de instancia es anormal.

  1. En el portal del FusionInsight Manager, haga clic en O&M > Alarm > Alarms, haga clic en en la fila donde se encuentra la alarma y haga clic en el nombre del host para ver la dirección del host para la que se genera la alarma
  2. En la página Alarms, compruebe si se ha generado el ALM-12006 Falla de nodo.

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 4.

  3. Manejar la alarma según ALM-12006 Falla de nodo.
  4. Inicie sesión en el host para el que se genera la alarma como usuario root. Compruebe si el usuario del directorio de instalación, el grupo de usuarios y el permiso del rol de alarma son correctos. El usuario, el grupo de usuarios y el permiso deben ser omm:ficommon 750.

    Por ejemplo, el directorio de instalación NameNode es ${BIGDATA_HOME}/FusionInsight_Current/1_8_NameNode/etc.

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 5.

  5. Ejecute el siguiente comando para establecer el permiso para 750 y User:Group para omm:ficommon:

    chmod 750 <folder_name>

    chown omm:ficommon <folder_name>

  6. Espere 5 minutos. En la lista de alarmas, compruebe si ALM-12007 Falla de proceso está borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 7.

Comprobar si el espacio de disco es suficiente.

  1. En el FusionInsight Manager, compruebe si la lista de alarmas contiene ALM-12017 Capacidad de disco no suficiente.

    • En caso afirmativo, vaya a 8.
    • Si no, vaya a 11.

  2. Rectifique la falla siguiendo los pasos indicados en el documento ALM-12017 Capacidad de disco insuficiente.
  3. Espere 5 minutos. En la lista de alarmas, compruebe si ALM-12017 Capacidad de disco no suficiente está borrado.

    • En caso afirmativo, vaya a 10.
    • Si no, vaya a 11.

  4. Espere 5 minutos. En la lista de alarmas, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 11.

Recopilar información de fallas.

  1. En el FusionInsight Manager, elija O&M > Log > Download.
  2. De acuerdo con el nombre del servicio obtenido en 1, seleccione el componente y el NodeAgent del Service y haga clic en OK.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe la información de registro recopilada.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna