ALM-27006 El uso de espacio en disco del directorio de datos supera el umbral
Descripción
El sistema comprueba el uso de espacio en disco del directorio de datos en el nodo DBServer activo cada 30 segundos y compara el uso del disco con el umbral. La alarma se genera cuando el uso de espacio en disco excede el umbral durante cinco veces consecutivas (el valor predeterminado). El número de veces consecutivas es configurable. El umbral de uso de espacio en disco del directorio de datos se establece en 80% de forma predeterminada, que también es configurable.
El valor de hit number es configurable. Cuando el valor se establece en 1 y el uso de espacio en disco es inferior o igual al umbral, la alarma se borra. Cuando el valor es mayor que 1 y el uso de espacio en disco es menor que 90% del umbral, la alarma se borra.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
27006 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
ClusterName |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
PartitionName |
Especifica la partición de disco donde se genera la alarma. |
Trigger Condition |
Especifica el umbral que activa la alarma. Si el valor del indicador real excede este umbral, se genera la alarma. |
Impacto en el sistema
- Los procesos de servicio no están disponibles.
- Cuando el uso de espacio en disco del directorio de datos supera el 90%, la base de datos informa de la alarma "Base de datos entra en el modo de solo lectura" y entra en el modo de solo lectura, lo que puede causar la pérdida de datos de servicio.
Causas posibles
- El umbral de alarma está configurado incorrectamente.
- El volumen de datos de la base de datos es demasiado grande o la configuración del disco no puede cumplir con los requisitos de servicio, lo que provoca un uso excesivo del disco.
Procedimiento
Comprobar si el umbral está configurado correctamente.
- En FusionInsight Manager, seleccione O&M > Alarm > Thresholds > Name of the desired cluster > DBService > Database > Disk Space Usage of the Data Directory para comprobar si el umbral de alarma es adecuado (el valor predeterminado 80% es un valor adecuado).
- Cambie el umbral de alarma en función de la situación real del servicio.
- Elija Cluster > Name of the desired cluster > Services > DBService. En la página Dashboard, vea el gráfico Disk Space Usage of the Data Directory y compruebe si el uso de espacio en disco del directorio de datos es inferior al umbral.
Figura 1 Uso del espacio en disco del directorio de datos
- Espere 2 minutos y compruebe si la alarma se borra automáticamente.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 5.
Comprobar si archivos grandes se escriben incorrectamente en el disco.
- Inicie sesión en el nodo DBService activo como usuario omm.
- Ejecute los siguientes comandos para ver los archivos cuyo tamaño excede los 500 MB en el directorio de datos y compruebe si hay archivos grandes escritos incorrectamente en el directorio:
source $DBSERVER_HOME/.dbservice_profile
find "$DBSERVICE_DATA_DIR"/../ -type f -size +500M
- Maneje los archivos de gran tamaño en función del escenario real y comprobar si la alarma se borra 2 minutos más tarde.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 8.
Recopilar información de fallas.
- En FusionInsight Manager, elija O&M > Log > Download.
- Expanda la lista desplegable Service y seleccione DBService para el clúster de destino.
- Especifique el host para recopilar registros estableciendo el parámetro Host que es opcional. De forma predeterminada, se seleccionan todos los hosts.
- Haga clic en
en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna