Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda> MapReduce Service> Guía del usuario> Referencia de alarma (aplicable a MRS 3.x)> ALM-27006 El uso de espacio en disco del directorio de datos supera el umbral
Actualización más reciente 2023-11-20 GMT+08:00

ALM-27006 El uso de espacio en disco del directorio de datos supera el umbral

Descripción

El sistema comprueba el uso de espacio en disco del directorio de datos en el nodo DBServer activo cada 30 segundos y compara el uso del disco con el umbral. La alarma se genera cuando el uso de espacio en disco excede el umbral durante cinco veces consecutivas (el valor predeterminado). El número de veces consecutivas es configurable. El umbral de uso de espacio en disco del directorio de datos se establece en 80% de forma predeterminada, que también es configurable.

El valor de hit number es configurable. Cuando el valor se establece en 1 y el uso de espacio en disco es inferior o igual al umbral, la alarma se borra. Cuando el valor es mayor que 1 y el uso de espacio en disco es menor que 90% del umbral, la alarma se borra.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

27006

Importante

Parámetros

Nombre

Significado

ClusterName

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

PartitionName

Especifica la partición de disco donde se genera la alarma.

Trigger Condition

Especifica el umbral que activa la alarma. Si el valor del indicador real excede este umbral, se genera la alarma.

Impacto en el sistema

  • Los procesos de servicio no están disponibles.
  • Cuando el uso de espacio en disco del directorio de datos supera el 90%, la base de datos informa de la alarma "Base de datos entra en el modo de solo lectura" y entra en el modo de solo lectura, lo que puede causar la pérdida de datos de servicio.

Causas posibles

  • El umbral de alarma está configurado incorrectamente.
  • El volumen de datos de la base de datos es demasiado grande o la configuración del disco no puede cumplir con los requisitos de servicio, lo que provoca un uso excesivo del disco.

Procedimiento

Comprobar si el umbral está configurado correctamente.

  1. En FusionInsight Manager, seleccione O&M > Alarm > Thresholds > Name of the desired cluster > DBService > Database > Disk Space Usage of the Data Directory para comprobar si el umbral de alarma es adecuado (el valor predeterminado 80% es un valor adecuado).

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 2.

  2. Cambie el umbral de alarma en función de la situación real del servicio.
  3. Elija Cluster > Name of the desired cluster > Services > DBService. En la página Dashboard, vea el gráfico Disk Space Usage of the Data Directory y compruebe si el uso de espacio en disco del directorio de datos es inferior al umbral.

    • En caso afirmativo, vaya a 4.
    • Si no, vaya a 5.
    Figura 1 Uso del espacio en disco del directorio de datos

  4. Espere 2 minutos y compruebe si la alarma se borra automáticamente.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 5.

    Comprobar si archivos grandes se escriben incorrectamente en el disco.

  5. Inicie sesión en el nodo DBService activo como usuario omm.
  6. Ejecute los siguientes comandos para ver los archivos cuyo tamaño excede los 500 MB en el directorio de datos y compruebe si hay archivos grandes escritos incorrectamente en el directorio:

    source $DBSERVER_HOME/.dbservice_profile

    find "$DBSERVICE_DATA_DIR"/../ -type f -size +500M

    • En caso afirmativo, vaya a 7.
    • Si no, vaya a 8.

  7. Maneje los archivos de gran tamaño en función del escenario real y comprobar si la alarma se borra 2 minutos más tarde.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 8.

    Recopilar información de fallas.

  8. En FusionInsight Manager, elija O&M > Log > Download.
  9. Expanda la lista desplegable Service y seleccione DBService para el clúster de destino.
  10. Especifique el host para recopilar registros estableciendo el parámetro Host que es opcional. De forma predeterminada, se seleccionan todos los hosts.
  11. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  12. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna