Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-12017 Capacidad de disco insuficiente (para MRS 2.x o anterior)

Descripción

El sistema comprueba el uso del disco host cada 30 segundos y compara el uso real del disco con el umbral. El uso del disco tiene un umbral predeterminado. Esta alarma se genera si el uso del disco excede el umbral.

Para cambiar el umbral, elija System >Threshold Configuration.

Esta alarma se borra cuando el uso del disco host es menor o igual que el umbral.

Atributo

ID de alarma

Severidad de alarma

Borrar automáticamente

12017

Grave

Parámetros

Parámetro

Descripción

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

PartitionName

Especifica la partición de disco para la que se genera la alarma.

Trigger Condition

Genera una alarma cuando el valor real del indicador excede el umbral especificado.

Impacto en el sistema

Los procesos de servicio no están disponibles.

Causas posibles

La configuración del disco no puede cumplir los requisitos de servicio. El uso del disco alcanza el límite superior.

Procedimiento

  1. Inicie sesión en MRS Manager y compruebe si el umbral es apropiado.

    1. El umbral predeterminado es 90%. Puede cambiar el umbral para cumplir con los requisitos de servicio.
      • En caso afirmativo, vaya a 2.
      • Si no, vaya a 1.b.
    2. Elija System > Threshold Configuration y cambie el umbral de alarma en función del uso real del disco.
    3. Espere 2 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 2.

  2. Compruebe si el disco es un disco del sistema.

    1. Vaya a la página de detalles del clúster de MRS. En la lista de alarmas de la página de pestaña de gestión de alarmas, haga clic en la fila que contiene la alarma. En los detalles de la alarma, vea el nombre del host y la información de la partición del disco.
    2. Inicie sesión en el nodo para el que se genera la alarma.
    3. Ejecute el comando df -h para comprobar el uso de la partición del disco del sistema. Compruebe si el disco está montado en cualquiera de los siguientes directorios utilizando el nombre de partición de disco obtenido en las versiones 2.a: /, /boot, /home, /opt, /tmp, /var, /var/log, /boot y /srv/BigData.
      • En caso afirmativo, el disco es un disco del sistema. Entonces vaya a 3.a.
      • Si no, el disco no es un disco del sistema. Entonces vaya a 2.d.
    4. Ejecute el comando df -h para comprobar el uso de la partición del disco del sistema. Determine el rol del disco basado en el nombre de la partición de disco obtenido en 2.a.
    5. Compruebe si el disco es utilizado por HDFS o Yarn.
      • Si es así, expanda la capacidad del disco para el nodo Core. Entonces vaya a 2.f.
      • Si no, vaya a 4.
    6. Espere 2 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 3.

  3. Compruebe si los archivos grandes están escritos en el disco.

    1. Ejecute el comando find / -xdev -size +500M -exec ls -l {} \; para ver archivos de más de 500 MB en el nodo. Compruebe si dichos archivos están escritos en el disco.
      • En caso afirmativo, vaya a 3.b.
      • Si no, vaya a 4.
    2. Maneje los archivos grandes y compruebe si la alarma se borra 2 minutos después.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 4.
    3. Amplíe la capacidad del disco.
    4. Espere 2 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 4.

  4. Recopile información de fallas.

    1. En MRS Manager, seleccione System > Export Log.
    2. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Referencia

Ninguna