ALM-12007 Falla de proceso
Descripción
Esta alarma se genera cuando el módulo de comprobación de estado de proceso detecta que el estado de conexión de proceso es Bad tres veces consecutivas. El módulo de comprobación de estado del proceso comprueba el estado del proceso cada 5 segundos.
Esta alarma se borra cuando se puede conectar el proceso.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
12007 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster o sistema para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El servicio proporcionado por el proceso no está disponible.
Causas posibles
- El proceso de instancia es anormal.
- El espacio del disco no es suficiente.
Si existe un gran número de alarmas de falla de proceso en un segmento de tiempo, los archivos en el directorio de instalación pueden borrarse por error o el permiso en el directorio puede modificarse.
Procedimiento
Comprobar si el proceso de instancia es anormal.
- En el portal del FusionInsight Manager, haga clic en O&M > Alarm > Alarms, haga clic en en la fila donde se encuentra la alarma y haga clic en el nombre del host para ver la dirección del host para la que se genera la alarma
- En la página Alarms, compruebe si se ha generado el ALM-12006 Falla de nodo.
- Manejar la alarma según ALM-12006 Falla de nodo.
- Inicie sesión en el host para el que se genera la alarma como usuario root. Compruebe si el usuario del directorio de instalación, el grupo de usuarios y el permiso del rol de alarma son correctos. El usuario, el grupo de usuarios y el permiso deben ser omm:ficommon 750.
Por ejemplo, el directorio de instalación NameNode es ${BIGDATA_HOME}/FusionInsight_Current/1_8_NameNode/etc.
- Ejecute el siguiente comando para establecer el permiso para 750 y User:Group para omm:ficommon:
chmod 750 <folder_name>
chown omm:ficommon <folder_name>
- Espere 5 minutos. En la lista de alarmas, compruebe si ALM-12007 Falla de proceso está borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 7.
Comprobar si el espacio de disco es suficiente.
- En el FusionInsight Manager, compruebe si la lista de alarmas contiene ALM-12017 Capacidad de disco no suficiente.
- Rectifique la falla siguiendo los pasos indicados en el documento ALM-12017 Capacidad de disco insuficiente.
- Espere 5 minutos. En la lista de alarmas, compruebe si ALM-12017 Capacidad de disco no suficiente está borrado.
- Espere 5 minutos. En la lista de alarmas, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 11.
Recopilar información de fallas.
- En el FusionInsight Manager, elija O&M > Log > Download.
- De acuerdo con el nombre del servicio obtenido en 1, seleccione el componente y el NodeAgent del Service y haga clic en OK.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe la información de registro recopilada.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna