Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

Indicadores de comprobación de estado de HDFS

Tiempo promedio de envío de paquetes

Indicador: Tiempo promedio de envío de paquetes

Descripción: Este indicador se utiliza para recopilar estadísticas sobre el tiempo promedio para que el DataNode en el HDFS ejecute SendPacket cada vez. Si el tiempo promedio es mayor que 2,000,000 ns, el DataNode no es saludable.

Guía de recuperación: Si el indicador es anormal, compruebe si la velocidad de red del clúster es normal y si el uso de memoria o CPU es demasiado alto. Compruebe si la carga HDFS en el clúster es alta.

Estado de salud del servicio

Indicador: Estado del servicio

Descripción: Este indicador se utiliza para comprobar si el estado del servicio HDFS es normal. Si un nodo está defectuoso, el host no está sano.

Guía de recuperación: Si el indicador es anormal, compruebe si el estado de salud de los servicios KrbServer, LdapServer y ZooKeeper es defectuoso. De ser así, rectifique la falla. A continuación, compruebe si el error de escritura de archivos es causado por HDFS SafeMode ON. Utilice el cliente para comprobar si los datos no se pueden escribir en HDFS y localizar la causa del error de escritura de datos de HDFS. Maneje la alarma siguiendo las instrucciones del documento de procesamiento de alarmas.

Comprobación de alarma

Indicador: Información de alarma

Descripción: Este indicador se utiliza para comprobar si existen alarmas. Si existen alarmas, el servicio no está sano.

Guía de recuperación: Si este indicador es anormal, puede corregir la falla consultando la guía de manejo de alarmas.