ALM-14001 El uso del disco HDFS supera el umbral
Descripción
El sistema comprueba el uso del disco HDFS cada 30 segundos y compara el uso real del disco HDFS con el umbral. El indicador de uso del disco HDFS tiene un umbral predeterminado, esta alarma se genera cuando el valor del uso del disco de un indicador de sistema de archivos distribuido de Hadoop (HDFS) excede el umbral.
Para cambiar el umbral, elija O&M >Alarm > Thresholds >Name of the desired cluster > HDFS.
Cuando el Trigger Count es 1, esta alarma se borra cuando el valor del uso del disco del indicador de clúster HDFS es menor o igual que el umbral. Cuando el Trigger Count es mayor que 1, esta alarma se borra cuando el valor del uso del disco del indicador de clúster HDFS es menor o igual al 90% del umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
14001 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
NameServiceName |
Especifica el NameService para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma. |
Impacto en el sistema
La escritura de datos del sistema de archivos distribuido (HDFS) de Hadoop se ve afectada.
Causas posibles
El espacio en disco configurado para el clúster HDFS es insuficiente.
Procedimiento
Compruebe la capacidad del disco y elimine los archivos innecesarios.
- En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > HDFS.
- Haga clic en el menú desplegable en la esquina superior derecha de Chart, elija Customize > Disk, y seleccione Percentage of HDFS Capacity para comprobar si el uso del disco HDFS excede el umbral (80% de forma predeterminada).
- En el área Basic Information, haga clic en el NameNode(Active) del NameService de errores y se mostrará la página HDFS WebUI.
De forma predeterminada, el usuario admin no tiene los permisos para gestionar otros componentes. Si la página no se puede abrir o el contenido mostrado está incompleto al acceder a la interfaz de usuario nativa de un componente debido a la falta de permisos, puede crear manualmente un usuario con los permisos para gestionar ese componente.
- En la interfaz de usuario web HDFS (WebUI), haga clic en la pestaña Datanodes. En la columna Block pool used, vea el uso del disco de todos los DataNodes para comprobar si el uso del disco de cualquier DataNode excede el umbral.
Figura 1 Información de Datanode
- Inicie sesión en el nodo cliente de como usuario root.
- Ejecute cd /opt/client para cambiar al directorio de instalación del cliente y ejecute source bigdata_env. Si el clúster utiliza el modo de seguridad, realice la autenticación de seguridad. Ejecute kinit hdfs e introduzca la contraseña como se le solicite. Por favor, obtenga la contraseña del administrador.
- Ejecute el comando hdfs dfs -rm -r file or directory para eliminar archivos innecesarios.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 9.
Expandir el sistema.
- Amplíe la capacidad del disco.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 11.
Recopilar información de fallas.
- En el portal del FusionInsight Manager, elija O&M > Log > Download.
- Seleccione los siguientes nodos en el clúster requerido desde el Service:
- ZooKeeper
- HDFS
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna