Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-14001 El uso del disco HDFS supera el umbral

Descripción

El sistema comprueba el uso del disco HDFS cada 30 segundos y compara el uso real del disco HDFS con el umbral. El indicador de uso del disco HDFS tiene un umbral predeterminado, esta alarma se genera cuando el valor del uso del disco de un indicador de sistema de archivos distribuido de Hadoop (HDFS) excede el umbral.

Para cambiar el umbral, elija O&M >Alarm > Thresholds >Name of the desired cluster > HDFS.

Cuando el Trigger Count es 1, esta alarma se borra cuando el valor del uso del disco del indicador de clúster HDFS es menor o igual que el umbral. Cuando el Trigger Count es mayor que 1, esta alarma se borra cuando el valor del uso del disco del indicador de clúster HDFS es menor o igual al 90% del umbral.

Atributo

ID de alarma

Gravedad de la alarma

Borrado automáticamente

14001

Importante

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

NameServiceName

Especifica el NameService para el que se genera la alarma.

Trigger Condition

Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma.

Impacto en el sistema

La escritura de datos del sistema de archivos distribuido (HDFS) de Hadoop se ve afectada.

Causas posibles

El espacio en disco configurado para el clúster HDFS es insuficiente.

Procedimiento

Compruebe la capacidad del disco y elimine los archivos innecesarios.

  1. En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HDFS.
  2. Haga clic en el menú desplegable en la esquina superior derecha de Chart, elija Customize > Disk, y seleccione Percentage of HDFS Capacity para comprobar si el uso del disco HDFS excede el umbral (80% de forma predeterminada).

    • En caso afirmativo, vaya a 3.
    • Si no, vaya a 11.

  3. En el área Basic Information, haga clic en el NameNode(Active) del NameService de errores y se mostrará la página HDFS WebUI.

    De forma predeterminada, el usuario admin no tiene los permisos para gestionar otros componentes. Si la página no se puede abrir o el contenido mostrado está incompleto al acceder a la interfaz de usuario nativa de un componente debido a la falta de permisos, puede crear manualmente un usuario con los permisos para gestionar ese componente.

  4. En la interfaz de usuario web HDFS (WebUI), haga clic en la pestaña Datanodes. En la columna Block pool used, vea el uso del disco de todos los DataNodes para comprobar si el uso del disco de cualquier DataNode excede el umbral.

    • En caso afirmativo, vaya a 6.
    • Si no, vaya a 11.
    Figura 1 Información de Datanode

  5. Inicie sesión en el nodo cliente de como usuario root.
  6. Ejecute cd /opt/client para cambiar al directorio de instalación del cliente y ejecute source bigdata_env. Si el clúster utiliza el modo de seguridad, realice la autenticación de seguridad. Ejecute kinit hdfs e introduzca la contraseña como se le solicite. Por favor, obtenga la contraseña del administrador.
  7. Ejecute el comando hdfs dfs -rm -r file or directory para eliminar archivos innecesarios.
  8. Verifique si la alarma se ha borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 9.

Expandir el sistema.

  1. Amplíe la capacidad del disco.
  2. Verifique si la alarma se ha borrado.

    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 11.

Recopilar información de fallas.

  1. En el portal del FusionInsight Manager, elija O&M > Log > Download.
  2. Seleccione los siguientes nodos en el clúster requerido desde el Service:

    • ZooKeeper
    • HDFS

  3. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
  4. Póngase en contacto con el y envíe los registros recopilados.

Eliminación de alarmas

Después de rectificar la falla, el sistema borra automáticamente esta alarma.

Información relacionada

Ninguna