Indicadores de comprobación de estado de HDFS
Tiempo promedio de envío de paquetes
Indicador: Tiempo promedio de envío de paquetes
Descripción: Este indicador se utiliza para recopilar estadísticas sobre el tiempo promedio para que el DataNode en el HDFS ejecute SendPacket cada vez. Si el tiempo promedio es mayor que 2,000,000 ns, el DataNode no es saludable.
Guía de recuperación: Si el indicador es anormal, compruebe si la velocidad de red del clúster es normal y si el uso de memoria o CPU es demasiado alto. Compruebe si la carga HDFS en el clúster es alta.
Estado de salud del servicio
Indicador: Estado del servicio
Descripción: Este indicador se utiliza para comprobar si el estado del servicio HDFS es normal. Si un nodo está defectuoso, el host no está sano.
Guía de recuperación: Si el indicador es anormal, compruebe si el estado de salud de los servicios KrbServer, LdapServer y ZooKeeper es defectuoso. De ser así, rectifique la falla. A continuación, compruebe si el error de escritura de archivos es causado por HDFS SafeMode ON. Utilice el cliente para comprobar si los datos no se pueden escribir en HDFS y localizar la causa del error de escritura de datos de HDFS. Maneje la alarma siguiendo las instrucciones del documento de procesamiento de alarmas.
Comprobación de alarma
Indicador: Información de alarma
Descripción: Este indicador se utiliza para comprobar si existen alarmas. Si existen alarmas, el servicio no está sano.
Guía de recuperación: Si este indicador es anormal, puede corregir la falla consultando la guía de manejo de alarmas.