Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-14002 El uso del disco de DataNode supera el umbral (Para MRS 2.x o anterior)

Descripción

El sistema comprueba el uso del disco de DataNode cada 30 segundos y compara el uso real del disco con el umbral. El indicador Percentage of DataNode Capacity tiene un umbral predeterminado. Esta alarma se genera cuando el valor del indicador Percentage of DataNode Capacity excede el umbral.

Esta alarma se borra cuando el valor del indicador Percentage of DataNode Capacity es menor o igual que el umbral.

Atributo

ID de alarma

Gravedad de alarma

Borrar automáticamente

14002

Grave

Parámetros

Parámetro

Descripción

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Trigger condition

Genera una alarma cuando el valor real del indicador excede el umbral especificado.

Impacto en el sistema

La falta de espacio en disco afectará a la lectura/escritura en HDFS.

Causas posibles

  • El espacio en disco configurado para el clúster HDFS es insuficiente.
  • La desviación de los datos se produce entre los DataNodes.

Procedimiento

  1. Compruebe la capacidad del disco del clúster.

    1. Vaya a la página de detalles del clúster de MRS. En la página Alarms, compruebe si existe la alarma ALM-14001 El uso de disco de HDFS excede el umbral.
      • En caso afirmativo, vaya a 1.b.
      • Si no, vaya a 2.a.
    2. Maneje la alarma siguiendo las instrucciones en ALM-14001 El uso de disco de HDFS excede el umbral y compruebe si la alarma está borrada.
      • En caso afirmativo, vaya a 1.c.
      • Si no, vaya a 3.
    3. Espere 5 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 2.a.

  2. Comprueba el estado del saldo de DataNodes.

    1. Utilice el cliente en el nodo del clúster, ejecute el comando hdfs dfsadmin -report para ver el valor de DFS Used% en el DataNode para el que se genera la alarma y compare el valor con los de otros DataNodes. Compruebe si la diferencia entre los valores es mayor que 10.
      • En caso afirmativo, vaya a 2.b.
      • Si no, vaya a 3.
    2. Si se produce un sesgo de datos, utilice el cliente en el nodo del clúster y ejecute el comando hdfs balancer -threshold 10.
    3. Espere 5 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 3.

  3. Recopilar información de fallas.

    1. En MRS Manager, seleccione System > Export Log.
    2. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Referencia

Ninguna