Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-14010 NameService es anormal (Para MRS 2.x o anterior)

Descripción

El sistema comprueba el estado del servicio NameService cada 180 segundos. Esta alarma se genera cuando el servicio NameService no está disponible.

Esta alarma se borra cuando se recupera el servicio NameService.

Atributo

ID de alarma

Gravedad de alarma

Borrar automáticamente

14010

Grave

Parámetros

Parámetro

Descripción

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

NSName

Especifica el servicio NameService para el que se genera la alarma.

Impacto en el sistema

HDFS no proporciona servicios para componentes de capa superior basados en el servicio NameService, como HBase y MapReduce. Como resultado, los usuarios no pueden leer ni escribir archivos.

Causas posibles

  • El JournalNode es defectuosa.
  • El DataNode está defectuoso.
  • La capacidad del disco es insuficiente.
  • El NameNode entra en modo seguro.

Procedimiento

  1. Compruebe el estado de la instancia de JournalNode.

    1. En la página de inicio del MRS Manager haga clic en Components.
    2. Haga clic en HDFS.
    3. Haga clic en Instance.
    4. Comprueba si el Health Status del JournalNode es Good.
      • En caso afirmativo, vaya a 2.a.
      • Si no, vaya a 1.e.
    5. Seleccione el JournalNode defectuoso y elija More > Restart Instance. Compruebe si el JournalNode se reinicia correctamente.
      • En caso afirmativo, vaya a 1.f.
      • Si no, vaya a 5.
    6. Espere 5 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 2.a.

  2. Compruebe el estado de la instancia de DataNode.

    1. En la página de detalles del clúster de MRS, haga clic en Components.
    2. Haga clic en HDFS.
    3. En el caso de Operation and Health Summary, compruebe si el Health Status de todos los DataNodes es Good.
      • En caso afirmativo, vaya a 3.a.
      • Si no, vaya a 2.d.
    4. Haga clic en Instances. En la página de gestión del DataNode, seleccione el DataNode defectuoso y elija More > Restart Instance. Compruebe si el DataNode se reinicia correctamente.
      • En caso afirmativo, vaya a 2.e.
      • Si no, vaya a 3.a.
    5. Espere 5 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 4.a.

  3. Verifique el estado del disco.

    1. En la página de detalles del clúster de MRS, haga clic en la pestaña Nodes y expanda un grupo de nodos.
    2. En la columna Disk Usage, compruebe si el espacio en disco es insuficiente.
      • En caso afirmativo, vaya a 3.c.
      • Si no, vaya a 4.a.
    3. Amplíe la capacidad del disco.
    4. Espere 5 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 4.a.

  4. Compruebe si NameNode está en el modo seguro.

    1. Utilice el cliente en el nodo del clúster y ejecute el comando hdfs dfsadmin -safemode get para comprobar si se muestra Safe mode is ON.

      La información detrás de Safe mode is ON es información de alarma y se muestra en función de las condiciones reales.

      • En caso afirmativo, vaya a 4.b.
      • Si no, vaya a 5.
    2. Utilice el cliente en el nodo del clúster y ejecute el comando hdfs dfsadmin -safemode leave.
    3. Espere 5 minutos y compruebe si la alarma está desactivada.
      • En caso afirmativo, no es necesario hacer nada más.
      • Si no, vaya a 5.

  5. Recopilar información de fallas.

    1. En MRS Manager, seleccione System > Export Log.
    2. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Referencia

Ninguna