ALM-12017 Capacidad de disco insuficiente
Descripción
El sistema comprueba el uso del disco host del sistema cada 30 segundos y compara el uso real del disco con el umbral. El uso del disco tiene un umbral predeterminado, esta alarma se genera cuando el uso del disco host excede el umbral especificado.
Cuando el Trigger Count es 1, esta alarma se borra cuando el uso de una partición de disco host es menor o igual al umbral. Cuando el Trigger Count es mayor que 1, esta alarma se borra cuando el uso de una partición de disco host es menor o igual al 90% del umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automático |
---|---|---|
12017 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster o sistema para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
PartitionName |
Especifica la partición de dispositivo para la que se genera la alarma. |
Trigger Condition |
Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma. |
Impacto en el sistema
Los procesos de servicio no están disponibles.
Causas posibles
- El umbral de alarma es incorrecto.
- La configuración de disco del servidor no puede cumplir los requisitos de servicio.
Procedimiento
Comprobar si el umbral de alarma es adecuado.
- Inicie sesión en FusionInsight Manager, elija O&M > Alarm > Thresholds > Name of the desired cluster > Host > Disk > Disk Usage y compruebe si el umbral (configurable, 90% por defecto) es apropiado.
- Elija O&M > Alarm > Thresholds > Name of the desired cluster > Host > Disk > Disk Usage y haga clic en Modify en la columna Operation para cambiar el umbral de alarma según los requisitos del sitio. Como se muestra en Figura 1:
- Después de 2 minutos, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 4.
Comprobar si el uso del disco alcanza el límite superior.
- En la lista de alarmas del Administrador de FusionInsight, haga clic en en la fila donde se encuentra la alarma para ver el nombre del host de la alarma y la información de la partición del disco en los detalles de la alarma.
- Inicie sesión en el nodo donde se genera la alarma como root.
- Ejecute el comando df -lmPT | awk '$2!= "iso9660"' | grep '^/dev/' | awk '{"readlink -m "$1 | getline real }{$1=real; print $0}' | sort -u -k 1,1 para comprobar el uso de la partición del disco del sistema. Compruebe si el disco está montado en los siguientes directorios basándose en el nombre de partición de disco obtenido en 4: /, /opt, /tmp, /var, /var/log y /srv/BigData(puede personalizarse).
- Ejecute el comando df -lmPT | awk '$2!= "iso9660"' | grep '^/dev/' | awk '{"readlink -m "$1 | getline real }{$1=real; print $0}' | sort -u -k 1,1 para comprobar el uso de la partición del disco del sistema. Determine el rol del disco basado en el nombre de la partición de disco obtenido en 4.
- Compruebe el servicio de disco.
- Después de 2 minutos, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 12.
- Ejecute el comando find / -xdev -size +500M -execls -l {} \; para comprobar si existe un archivo de más de 500 MB en el nodo y en el disco.
- Maneje el archivo grande y comprobar si la alarma se borra 2 minutos más tarde.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 12.
- Póngase en contacto con el administrador del sistema para ampliar la capacidad del disco.
- Después de 2 minutos, compruebe si la alarma está borrada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 14.
Recopilar información de fallas.
- En FusionInsight Manager, elija O&M > Log > Download.
- Seleccione OMS en el Service y haga clic en OK.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe la información de registro recopilada.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna