Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-12070 El recurso del controller es anormal

Actualización más reciente 2023-11-20 GMT+08:00

Ver PDF

ALM-12070 El recurso del controller es anormal

Descripción de la alarma

HA comprueba los recursos del controller de Manager cada 80 segundos. Esta alarma se genera cuando HA detecta que los recursos del controller son anormales durante 2 veces consecutivas.

Esta alarma se borra cuando el recurso Controller es normal.

Resource Type del Controller es Single-active. Activo/en espera se activará en caso de excepciones de recursos. Cuando se genera esta alarma, se completa la conmutación activa/en espera y se han habilitado nuevos recursos del Controller en el nuevo FusionInsight Manager activo. En este caso, esta alarma se borra. Esta alarma se utiliza para notificar a los usuarios de la causa de la conmutación activa/en espera.

Atributo

ID de alarma	Gravedad de la alarma	Borrar automáticamente
12070	Importante	Sí

Parámetros

Parámetro	Descripción
Source	Especifica el clúster o sistema para el que se genera la alarma.
ServiceName	Especifica el nombre del servicio para el que se genera la alarma.
RoleName	Especifica el rol para el que se genera la alarma.
HostName	Especifica el host para el que se genera la alarma.

Impacto en el sistema

Se produce la conmutación del FusionInsight Manager activo/en espera.
El proceso del Controller se reinicia repetidamente, lo que puede provocar un error de inicio de sesión del FusionInsight Manager.

Causas posibles

El proceso del Controller es anormal.

Procedimiento

Comprobar si el proceso del controller es normal.

En la lista de alarmas del FusionInsight Manager, busque la fila que contiene la alarma y vea el nombre del host para el que se genera la alarma.
Inicie sesión en el host para el que se genera la alarma como usuario root.
Ejecute el comando su - omm para cambiar al omm del usuario.Ejecute el comando sh ${BIGDATA_HOME}/om-server/OMS/workspace0/ha/module/hacom/script/status_ha.sh para comprobar si el estado de los recursos del Controller gestionados por el HA es normal. En el sistema de nodo único, el recurso Controller está en el estado normal. En el sistema de nodo doble, el recurso del controller está en el estado normal en el nodo activo y en el estado detenido en el nodo de espera.
- Si lo es, vaya a 6.
- Si no es así, vaya a 4.
Ejecute el comando vi $BIGDATA_LOG_HOME/omm/oms/ha/scriptlog/controller.log para ver los registros de recursos del controller y ejecute el comando vi $BIGDATA_LOG_HOME/controller/controller.log para ver los registros de ejecución del controller, compruebe si existe la palabra clave ERROR. Analice los registros para localizar y rectificar la falla.
Cinco minutos más tarde, compruebe si esta alarma está desactivada.
- Si lo es, no se requiere ninguna otra acción.
- Si no es así, vaya a 6.

Recopilar información de fallas.

En FusionInsight Manager, elija O&M > Log > Download.
Seleccione Controller y OmmServe para Service y haga clic en OK.
Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 1 hora antes y después del tiempo de generación de alarma, respectivamente. A continuación, haga clic en Download.
Póngase en contacto con el y envíe la información de registro recopilada.