Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-27001 DBService no disponible

Descripción

El módulo de alarma comprueba el estado del servicio de DBService cada 30 segundos. Esta alarma se genera cuando el sistema detecta que el servicio DBService no está disponible.

Esta alarma se borra cuando se recupera el servicio DBService.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

27001

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

El servicio de base de datos no está disponible y no puede proporcionar funciones de importación y consulta de datos para los servicios de capa superior, lo que da como resultado algunas excepciones de servicios.

Causas posibles

  • La dirección IP flotante no existe.
  • No hay una instancia de DBServer activa.
  • Los procesos DBServer activo y en espera son anormales.

Procedimiento

Comprobar si la dirección IP flotante existe en el entorno del clúster.

  1. En la página principal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > DBService > Instance.
  2. Compruebe si existe la instancia activa.

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 9.

  3. Seleccione la instancia de DBServer activa y registre la dirección IP.
  4. Inicie sesión en el host que corresponde a la dirección IP anterior como usuario root y ejecute el comando ifconfig para comprobar si existe la dirección IP flotante de DBService en el nodo.

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 9.

  5. Ejecute el comando ping floatip para comprobar si la dirección IP flotante DBService se puede hacer ping correctamente.

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 9.

  6. Inicie sesión en el host que corresponde a la dirección IP flotante de DBService como usuario root y ejecute el comando para eliminar la dirección IP flotante.

    ifconfig interface down

  7. En la página principal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > DBService > More > Restart Service para reiniciar DBService y compruebe si DBService se reinicia correctamente.

    • En caso afirmativo, vaya a 8.
    • Si no, vaya a 9.

  8. Espere unos 2 minutos y compruebe si la alarma está borrada en la lista de alarmas.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 14.

Comprobar el estado de la instancia activa de DBServer.

  1. Seleccione la instancia de DBServer cuyo estado de rol es anormal y registre la dirección IP.
  2. En la página Alarm , compruebe si se produce Process Fault en la instancia DBServer en el host que corresponde a la dirección IP.

    • En caso afirmativo, vaya a 11.
    • Si no, vaya a 14.

  3. Maneje la alarma según "ALM-12007 Falla de proceso".
  4. Espere unos 5 minutos y compruebe si la alarma está borrada en la lista de alarmas.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 19.

Comprobar el estado de los DBServers activos y en espera.

  1. Inicie sesión en el host que corresponde a la dirección IP anterior como usuario root y ejecute el comando su - omm para cambiar a usuario omm.
  2. Ejecute el comando cd ${DBSERVER_HOME} para ir al directorio de instalación del DBService.
  3. Ejecute el comando sh sbin/status-dbserver.sh para ver el estado de los procesos de HA activos y en espera de DBService. Determine si el estado se puede ver correctamente.

    HAMode 
    double 
    
    NodeName                  HostName               HAVersion                StartTime                HAActive             HAAllResOK           HARunPhase          
    10_5_89_12                host01                 V100R001C01              2019-06-13 21:33:09      active               normal               Actived             
    10_5_89_66                host03                 V100R001C01              2019-06-13 21:33:09      standby              normal               Deactived           
    
    NodeName                  ResName                ResStatus                ResHAStatus              ResType             
    10_5_89_12                floatip                Normal                   Normal                   Single_active       
    10_5_89_12                gaussDB                Active_normal            Normal                   Active_standby      
    10_5_89_66                floatip                Stopped                  Normal                   Single_active       
    10_5_89_66                gaussDB                Standby_normal           Normal                   Active_standby  
    • En caso afirmativo, vaya a 16.
    • Si no, vaya a 19.

  4. Compruebe si los procesos HA activo y en espera están en estado anormal.

    • En caso afirmativo, vaya a 17.
    • Si no, vaya a 19.

  5. En FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > DBService > More > Restart Service para reiniciar DBService y compruebe si el sistema muestra un mensaje que indica que el reinicio se ha realizado correctamente.

    • En caso afirmativo, vaya a 18.
    • Si no, vaya a 19.

  6. Espere unos 2 minutos y compruebe si la alarma está borrada en la lista de alarmas.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 19.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M >Log > Download.
  2. Seleccione DBService en el clúster requerido y NodeAgent en el Service.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 1 hora antes y después del tiempo de generación de alarma, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna