Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-27004 Incoherencia de datos entre DBServices activos y en espera (Para MRS 2.x o anterior)

Descripción

El sistema comprueba el estado de sincronización de datos entre los DBServices activo y en espera cada 10 segundos. Esta alarma se genera cuando el estado de sincronización no se puede consultar durante seis veces consecutivas o cuando el estado de sincronización es anormal.

Esta alarma se borra cuando la sincronización está en estado normal.

Atributo

ID de alarma

Severidad de alarma

Borrar automáticamente

27004

Crítica

Parámetros

Parámetro

Descripción

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Local DBService HA Name

Especifica un HA de DBService local.

Peer DBService HA Name

Especifica un HA de DBService del mismo nivel.

SYNC_PERSENT

Porcentaje de sincronización.

Impacto en el sistema

Cuando los datos no están sincronizados entre los DBServices activo y en espera, los datos pueden perderse o ser anormales si la instancia activa se vuelve anormal.

Causas posibles

  • La red entre los nodos activos y en espera es inestable.
  • El DBService en espera es anormal.
  • El espacio de disco del nodo en espera está lleno.

Procedimiento

  1. Compruebe si la red entre los nodos activos y en espera está en estado normal.

    1. Vaya a la página de detalles del clúster y elija Alarms.
    2. En la lista de alarmas, localice la fila que contiene la alarma y vea la dirección IP del nodo DBService en espera en los detalles de la alarma.
    3. Inicie sesión en el nodo DBService activo.
    4. Ejecute el comando ping heartbeat IP address of the standby DBService para comprobar si el nodo de DBService en espera es accesible.
      • En caso afirmativo, vaya a 2.a.
      • Si no, vaya a 1.e.
    5. Póngase en contacto con el personal de O&M para comprobar si la red es defectuosa.
      • En caso afirmativo, vaya a 1.f.
      • Si no, vaya a 2.a.
    6. Rectifique la falla de la red y compruebe si la alarma está borrada de la lista de alarmas.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 2.a.

  2. Compruebe si el DBService en espera está en estado normal.

    1. Inicie sesión en el nodo de DBService en espera.
    2. Ejecute los siguientes comandos para cambiar el usuario:

      sudo su - root

      su - omm

    3. Vaya al directorio ${DBSERVER_HOME}/sbin y ejecute el comando ./status-dbserver.sh para comprobar si el estado del recurso de GaussDB del DBService en espera está en estado normal. En la salida del comando, compruebe si se muestra la siguiente información en la fila donde ResName es gaussDB:

      Ejemplo:

      10_10_10_231 gaussDB Standby_normal Normal Active_standby
      • En caso afirmativo, vaya a 3.a.
      • Si no, vaya a 4.

  3. Compruebe si el espacio en disco del nodo en espera es insuficiente.

    1. Inicie sesión en el nodo de DBService en espera.
    2. Ejecute los siguientes comandos para cambiar el usuario:

      sudo su - root

      su - omm

    3. Vaya al directorio ${DBSERVER_HOME} y ejecute los siguientes comandos para obtener el directorio de datos de DBService:

      cd ${DBSERVER_HOME}

      source .dbservice_profile

      echo ${DBSERVICE_DATA_DIR}

    4. Ejecute el comando df -h para comprobar el uso de la partición del disco del sistema.
    5. Compruebe si el espacio de directorio de datos de DBService está lleno.
      • En caso afirmativo, vaya a 3.f.
      • Si no, vaya a 4.
    6. Realice la actualización y amplíe la capacidad.
    7. Después de la ampliación de la capacidad, espere 2 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 4.

  4. Recopilar información de fallas.

    1. En MRS Manager, seleccione System > Export Log.
    2. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Referencia

Ninguna