Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-12007 Falla de proceso

Actualización más reciente 2023-11-20 GMT+08:00

Ver PDF

ALM-12007 Falla de proceso

Descripción

Esta alarma se genera cuando el módulo de comprobación de estado de proceso detecta que el estado de conexión de proceso es Bad tres veces consecutivas. El módulo de comprobación de estado del proceso comprueba el estado del proceso cada 5 segundos.

Esta alarma se borra cuando se puede conectar el proceso.

Atributo

ID de alarma	Gravedad de la alarma	Borrar automáticamente
12007	Importante	Sí

Parámetros

Nombre	Significado
Source	Especifica el clúster o sistema para el que se genera la alarma.
ServiceName	Especifica el servicio para el que se genera la alarma.
RoleName	Especifica el rol para el que se genera la alarma.
HostName	Especifica el host para el que se genera la alarma.

Impacto en el sistema

El servicio proporcionado por el proceso no está disponible.

Causas posibles

El proceso de instancia es anormal.
El espacio del disco no es suficiente.

Si existe un gran número de alarmas de falla de proceso en un segmento de tiempo, los archivos en el directorio de instalación pueden borrarse por error o el permiso en el directorio puede modificarse.

Procedimiento

Comprobar si el proceso de instancia es anormal.

En el portal del FusionInsight Manager, haga clic en O&M > Alarm > Alarms, haga clic en en la fila donde se encuentra la alarma y haga clic en el nombre del host para ver la dirección del host para la que se genera la alarma
En la página Alarms, compruebe si se ha generado el ALM-12006 Falla de nodo.
- En caso afirmativo, vaya a 3.
- Si no, vaya a 4.
Manejar la alarma según ALM-12006 Falla de nodo.
Inicie sesión en el host para el que se genera la alarma como usuario root. Compruebe si el usuario del directorio de instalación, el grupo de usuarios y el permiso del rol de alarma son correctos. El usuario, el grupo de usuarios y el permiso deben ser omm:ficommon 750.

Por ejemplo, el directorio de instalación NameNode es ${BIGDATA_HOME}/FusionInsight_Current/1_8_NameNode/etc.
- En caso afirmativo, vaya a 6.
- Si no, vaya a 5.
Ejecute el siguiente comando para establecer el permiso para 750 y User:Group para omm:ficommon:

chmod 750 <folder_name>

chown omm:ficommon <folder_name>
Espere 5 minutos. En la lista de alarmas, compruebe si ALM-12007 Falla de proceso está borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 7.

Comprobar si el espacio de disco es suficiente.

En el FusionInsight Manager, compruebe si la lista de alarmas contiene ALM-12017 Capacidad de disco no suficiente.
- En caso afirmativo, vaya a 8.
- Si no, vaya a 11.
Rectifique la falla siguiendo los pasos indicados en el documento ALM-12017 Capacidad de disco insuficiente.
Espere 5 minutos. En la lista de alarmas, compruebe si ALM-12017 Capacidad de disco no suficiente está borrado.
- En caso afirmativo, vaya a 10.
- Si no, vaya a 11.
Espere 5 minutos. En la lista de alarmas, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 11.

Recopilar información de fallas.

En el FusionInsight Manager, elija O&M > Log > Download.
De acuerdo con el nombre del servicio obtenido en 1, seleccione el componente y el NodeAgent del Service y haga clic en OK.
Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
Póngase en contacto con el y envíe la información de registro recopilada.