ALM-27004 Incoherencia de datos entre DBServices activos y en espera (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el estado de sincronización de datos entre los DBServices activo y en espera cada 10 segundos. Esta alarma se genera cuando el estado de sincronización no se puede consultar durante seis veces consecutivas o cuando el estado de sincronización es anormal.
Esta alarma se borra cuando la sincronización está en estado normal.
Atributo
ID de alarma |
Severidad de alarma |
Borrar automáticamente |
---|---|---|
27004 |
Crítica |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Local DBService HA Name |
Especifica un HA de DBService local. |
Peer DBService HA Name |
Especifica un HA de DBService del mismo nivel. |
SYNC_PERSENT |
Porcentaje de sincronización. |
Impacto en el sistema
Cuando los datos no están sincronizados entre los DBServices activo y en espera, los datos pueden perderse o ser anormales si la instancia activa se vuelve anormal.
Causas posibles
- La red entre los nodos activos y en espera es inestable.
- El DBService en espera es anormal.
- El espacio de disco del nodo en espera está lleno.
Procedimiento
- Compruebe si la red entre los nodos activos y en espera está en estado normal.
- Vaya a la página de detalles del clúster y elija Alarms.
- En la lista de alarmas, localice la fila que contiene la alarma y vea la dirección IP del nodo DBService en espera en los detalles de la alarma.
- Inicie sesión en el nodo DBService activo.
- Ejecute el comando ping heartbeat IP address of the standby DBService para comprobar si el nodo de DBService en espera es accesible.
- Póngase en contacto con el personal de O&M para comprobar si la red es defectuosa.
- Rectifique la falla de la red y compruebe si la alarma está borrada de la lista de alarmas.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 2.a.
- Compruebe si el DBService en espera está en estado normal.
- Inicie sesión en el nodo de DBService en espera.
- Ejecute los siguientes comandos para cambiar el usuario:
su - omm
- Vaya al directorio ${DBSERVER_HOME}/sbin y ejecute el comando ./status-dbserver.sh para comprobar si el estado del recurso de GaussDB del DBService en espera está en estado normal. En la salida del comando, compruebe si se muestra la siguiente información en la fila donde ResName es gaussDB:
Ejemplo:
10_10_10_231 gaussDB Standby_normal Normal Active_standby
- Compruebe si el espacio en disco del nodo en espera es insuficiente.
- Inicie sesión en el nodo de DBService en espera.
- Ejecute los siguientes comandos para cambiar el usuario:
su - omm
- Vaya al directorio ${DBSERVER_HOME} y ejecute los siguientes comandos para obtener el directorio de datos de DBService:
cd ${DBSERVER_HOME}
source .dbservice_profile
echo ${DBSERVICE_DATA_DIR}
- Ejecute el comando df -h para comprobar el uso de la partición del disco del sistema.
- Compruebe si el espacio de directorio de datos de DBService está lleno.
- Realice la actualización y amplíe la capacidad.
- Después de la ampliación de la capacidad, espere 2 minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 4.
- Recopilar información de fallas.
- En MRS Manager, seleccione .
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna