ALM-27001 DBService no disponible
Descripción
El módulo de alarma comprueba el estado del servicio de DBService cada 30 segundos. Esta alarma se genera cuando el sistema detecta que el servicio DBService no está disponible.
Esta alarma se borra cuando se recupera el servicio DBService.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
27001 |
Crítica |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El servicio de base de datos no está disponible y no puede proporcionar funciones de importación y consulta de datos para los servicios de capa superior, lo que da como resultado algunas excepciones de servicios.
Causas posibles
- La dirección IP flotante no existe.
- No hay una instancia de DBServer activa.
- Los procesos DBServer activo y en espera son anormales.
Procedimiento
Comprobar si la dirección IP flotante existe en el entorno del clúster.
- En la página principal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > DBService > Instance.
- Compruebe si existe la instancia activa.
- Seleccione la instancia de DBServer activa y registre la dirección IP.
- Inicie sesión en el host que corresponde a la dirección IP anterior como usuario root y ejecute el comando ifconfig para comprobar si existe la dirección IP flotante de DBService en el nodo.
- Ejecute el comando ping floatip para comprobar si la dirección IP flotante DBService se puede hacer ping correctamente.
- Inicie sesión en el host que corresponde a la dirección IP flotante de DBService como usuario root y ejecute el comando para eliminar la dirección IP flotante.
ifconfig interface down
- En la página principal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > DBService > More > Restart Service para reiniciar DBService y compruebe si DBService se reinicia correctamente.
- Espere unos 2 minutos y compruebe si la alarma está borrada en la lista de alarmas.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 14.
Comprobar el estado de la instancia activa de DBServer.
- Seleccione la instancia de DBServer cuyo estado de rol es anormal y registre la dirección IP.
- En la página Alarm , compruebe si se produce Process Fault en la instancia DBServer en el host que corresponde a la dirección IP.
- Maneje la alarma según "ALM-12007 Falla de proceso".
- Espere unos 5 minutos y compruebe si la alarma está borrada en la lista de alarmas.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 19.
Comprobar el estado de los DBServers activos y en espera.
- Inicie sesión en el host que corresponde a la dirección IP anterior como usuario root y ejecute el comando su - omm para cambiar a usuario omm.
- Ejecute el comando cd ${DBSERVER_HOME} para ir al directorio de instalación del DBService.
- Ejecute el comando sh sbin/status-dbserver.sh para ver el estado de los procesos de HA activos y en espera de DBService. Determine si el estado se puede ver correctamente.
HAMode double NodeName HostName HAVersion StartTime HAActive HAAllResOK HARunPhase 10_5_89_12 host01 V100R001C01 2019-06-13 21:33:09 active normal Actived 10_5_89_66 host03 V100R001C01 2019-06-13 21:33:09 standby normal Deactived NodeName ResName ResStatus ResHAStatus ResType 10_5_89_12 floatip Normal Normal Single_active 10_5_89_12 gaussDB Active_normal Normal Active_standby 10_5_89_66 floatip Stopped Normal Single_active 10_5_89_66 gaussDB Standby_normal Normal Active_standby
- Compruebe si los procesos HA activo y en espera están en estado anormal.
- En FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > DBService > More > Restart Service para reiniciar DBService y compruebe si el sistema muestra un mensaje que indica que el reinicio se ha realizado correctamente.
- Espere unos 2 minutos y compruebe si la alarma está borrada en la lista de alarmas.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 19.
Recopilar información de fallas.
- En FusionInsight Manager, elija O&M >Log > Download.
- Seleccione DBService en el clúster requerido y NodeAgent en el Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 1 hora antes y después del tiempo de generación de alarma, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna