Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.

Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-14002 El uso del disco de DataNode supera el umbral

Actualización más reciente 2023-11-20 GMT+08:00

Ver PDF

ALM-14002 El uso del disco de DataNode supera el umbral

Descripción

El sistema comprueba el uso del disco de DataNode cada 30 segundos y compara el uso real del disco con el umbral. Se proporciona un rango de umbral predeterminado para el uso del disco de DataNode. Esta alarma se genera cuando el uso del disco DataNode excede el umbral.

Para cambiar el umbral, elija O&M > Alarm > Thresholds > Name of the desired cluster > HDFS.

Si Trigger Count tiene un valor 1, esta alarma se borra cuando el uso del disco DataNode es menor o igual al umbral. Si Trigger Count es mayor que 1, esta alarma se borra cuando el uso del disco DataNode es menor o igual al 80% del umbral.

Atributo

ID de alarma	Gravedad de la alarma	Borrar automáticamente
14002	Importante	Sí

Parámetros

Nombre	Significado
Source	Especifica el clúster para el que se genera la alarma.
ServiceName	Especifica el servicio para el que se genera la alarma.
RoleName	Especifica el rol para el que se genera la alarma.
HostName	Especifica el host para el que se genera la alarma.
Trigger Condition	Especifica el umbral para activar la alarma.

Impacto en el sistema

La falta de espacio en disco afectará a la escritura de datos en HDFS.

Causas posibles

El espacio en disco configurado para el clúster HDFS es insuficiente.
La desviación de los datos se produce entre los DataNodes.

Procedimiento

Compruebe si la capacidad del disco del clúster está llena.

En FusionInsight Manager, seleccione O&M > Alarm > Alarms y compruebe si existe la alarma ALM-14001 El uso del disco HDFS supera el umbral.
- En caso afirmativo, vaya a 2.
- Si no, vaya a 4.
Maneje la alarma siguiendo las instrucciones en ALM-14001 El uso del disco HDFS supera el umbral y compruebe si la alarma está desactivada.
- En caso afirmativo, vaya a 3.
- Si no, vaya a 11.
Elija O&M > Alarm > Alarms y compruebe si la alarma está desactivada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 4.

Verifique el estado del balanceo de DataNodes.

En FusionInsight Manager, seleccione Hosts. Compruebe si el número de DataNodes en cada rack es casi el mismo. Si la diferencia es grande, ajuste los racks a los que pertenecen DataNodes para asegurarse de que el número de DataNodes en cada rack es casi el mismo. Reinicie el servicio HDFS para que la configuración surta efecto.
Elija Cluster > Name of the desired cluster > Services > HDFS.
En el área Basic Information, haga clic en NameNode(Active). Se muestra la HDFS web UI.

De forma predeterminada, el usuario admin no tiene los permisos para gestionar otros componentes. Si la página no se puede abrir o el contenido mostrado está incompleto al acceder a la interfaz de usuario nativa de un componente debido a la falta de permisos, puede crear manualmente un usuario con los permisos para gestionar ese componente.
En el área Summary de la HDFS web UI, compruebe si el valor de Max es un 10% mayor que el de Median en DataNodes usages.
- En caso afirmativo, vaya a 8.
- Si no, vaya a 11.
Equilibre los datos sesgados en el clúster. Inicie sesión en el cliente de como usuario root. Si el clúster está en modo normal, ejecute el comando su - omm para cambiar a usuario omm. Ejecute el comando cd para ir al directorio de instalación del cliente y ejecute el comando source bigdata_env. Si el clúster utiliza el modo de seguridad, realice la autenticación de seguridad. Ejecute kinit hdfs e introduzca la contraseña como se le solicite. Obtenga la contraseña del administrador del clúster de MRS.
Ejecute el siguiente comando para equilibrar la distribución de datos:

hdfs balancer -threshold 10
Espere varios minutos y compruebe si la alarma está desactivada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 11.

Recopilar información de fallas.

En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
Expanda la lista desplegable junto al campo Service. En el cuadro de diálogo Services que se muestra, seleccione HDFS para el clúster de destino.
Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
Póngase en contacto con y proporcione los registros recopilados.