Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-12017 Capacidad de disco insuficiente

Descripción

El sistema comprueba el uso del disco host del sistema cada 30 segundos y compara el uso real del disco con el umbral. El uso del disco tiene un umbral predeterminado, esta alarma se genera cuando el uso del disco host excede el umbral especificado.

Cuando el Trigger Count es 1, esta alarma se borra cuando el uso de una partición de disco host es menor o igual al umbral. Cuando el Trigger Count es mayor que 1, esta alarma se borra cuando el uso de una partición de disco host es menor o igual al 90% del umbral.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automático

12017

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster o sistema para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

PartitionName

Especifica la partición de dispositivo para la que se genera la alarma.

Trigger Condition

Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma.

Impacto en el sistema

Los procesos de servicio no están disponibles.

Causas posibles

  • El umbral de alarma es incorrecto.
  • La configuración de disco del servidor no puede cumplir los requisitos de servicio.

Procedimiento

Comprobar si el umbral de alarma es adecuado.

  1. Inicie sesión en FusionInsight Manager, elija O&M > Alarm > Thresholds > Name of the desired cluster > Host > Disk > Disk Usage y compruebe si el umbral (configurable, 90% por defecto) es apropiado.

    • En caso afirmativo, vaya a 2.
    • Si no, vaya a 4.

  2. Elija O&M > Alarm > Thresholds > Name of the desired cluster > Host > Disk > Disk Usage y haga clic en Modify en la columna Operation para cambiar el umbral de alarma según los requisitos del sitio. Como se muestra en Figura 1:

    Figura 1 Establecer un umbral de alarma

  3. Después de 2 minutos, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 4.

Comprobar si el uso del disco alcanza el límite superior.

  1. En la lista de alarmas del Administrador de FusionInsight, haga clic en en la fila donde se encuentra la alarma para ver el nombre del host de la alarma y la información de la partición del disco en los detalles de la alarma.
  2. Inicie sesión en el nodo donde se genera la alarma como root.
  3. Ejecute el comando df -lmPT | awk '$2!= "iso9660"' | grep '^/dev/' | awk '{"readlink -m "$1 | getline real }{$1=real; print $0}' | sort -u -k 1,1 para comprobar el uso de la partición del disco del sistema. Compruebe si el disco está montado en los siguientes directorios basándose en el nombre de partición de disco obtenido en 4: /, /opt, /tmp, /var, /var/log y /srv/BigData(puede personalizarse).

    • En caso afirmativo, el disco es un disco del sistema. Entonces vaya a 10.
    • Si no, el disco no es un disco del sistema. Entonces vaya a 7.

  4. Ejecute el comando df -lmPT | awk '$2!= "iso9660"' | grep '^/dev/' | awk '{"readlink -m "$1 | getline real }{$1=real; print $0}' | sort -u -k 1,1 para comprobar el uso de la partición del disco del sistema. Determine el rol del disco basado en el nombre de la partición de disco obtenido en 4.
  5. Compruebe el servicio de disco.

    En , compruebe si el servicio de disco es HDFS, Yarn, Kafka, Supervisor.
    • En caso afirmativo, ajuste la capacidad. Entonces vaya a 9.
    • Si no, vaya a 12.

  6. Después de 2 minutos, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 12.

  7. Ejecute el comando find / -xdev -size +500M -execls -l {} \; para comprobar si existe un archivo de más de 500 MB en el nodo y en el disco.

    • En caso afirmativo, vaya a 11.
    • Si no, vaya a 12.

  8. Maneje el archivo grande y comprobar si la alarma se borra 2 minutos más tarde.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 12.

  9. Póngase en contacto con el administrador del sistema para ampliar la capacidad del disco.
  10. Después de 2 minutos, compruebe si la alarma está borrada.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 14.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione OMS en el Service y haga clic en OK.
  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe la información de registro recopilada.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna