Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-45001 Instancias de cómputo de HetuEngine defectuoso
Actualización más reciente 2023-11-20 GMT+08:00

ALM-45001 Instancias de cómputo de HetuEngine defectuoso

Esta alarma solo se aplica a MRS 3.2.0 o posterior.

Descripción

El sistema comprueba el estado de la instancia de cómputo de cada 60 segundos. Esta alarma se genera cuando una instancia de cómputo de es defectuosa.

Esta alarma se borra cuando se restauran todas las instancias de cómputo de defectuosas.

Atributo

ID de alarma

Severidad de alarma

Borrar automáticamente

45001

Grave

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

Las tareas de no se pueden ejecutar.

Causas posibles

  • El servicio HDFS es anormal.
  • El servicio Yarn es anormal.
  • Los recursos de cola de Yarn son insuficientes.
  • El proceso de las instancias de cómputo es defectuoso.

Procedimiento

Comprobar el estado de servicio HDFS.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-14000 Servicio HDFS no disponible."

    • En caso afirmativo, vaya a 2.
    • Si no, vaya a 4.

  2. Borre "ALM-14000 Servicio HDFS no disponible" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45001 Instancias de cómputo de defectuosas" está desactivada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 4.

Comprobar el estado de servicio YARN.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-18000 Servicio YARN no disponible".

    • En caso afirmativo, vaya a 5.
    • Si no, vaya a 7.

  2. Borre "ALM-18000 Servicio YARN no disponible" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45001 Instancias de cómputo de defectuosas" está desactivada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 7.

Comprobar el estado de recurso de cola de YARN.

  1. En la lista de alarmas, compruebe si se genera la alarma "ALM-18022 Recursos de cola de YARN insuficientes".

    • En caso afirmativo, vaya a 8.
    • Si no, vaya a 10.

  2. Borre "ALM-18022 Recursos de cola de YARN insuficientes" de acuerdo con la ayuda de alarma.
  3. En la lista de alarmas, compruebe si la alarma "ALM-45001 Instancias de cómputo de defectuosas" está desactivada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 10.

Comprobar el estado de instancia de cómputo de .

  1. Inicie sesión en FusionInsight Manager como administrador que puede acceder a la interfaz de usuario web de y elija Cluster > Services > .
  2. En el área Basic Information de la página de pestaña Dashboard, haga clic en el vínculo situado junto a HSConsole WebUI para acceder a la página HSConsole.
  3. En la página de instancia de cómputo, compruebe si alguna instancia de cómputo está en estado FAULT.

    • En caso afirmativo, vaya a 13.
    • Si no, vaya a 14.

  1. En la columna Operation de la instancia de cálculo de destino, haga clic en Start y espere hasta que se inicie la instancia.
  2. En la lista de alarmas, compruebe si la alarma "ALM-45001 Instancias de cómputo de defectuosas" está desactivada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 15.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. Expanda la lista desplegable Service. En el cuadro de diálogo Services que se muestra, seleccione en el nombre del clúster de destino y haga clic en OK.
  3. Expanda la lista desplegable Hosts. En el cuadro de diálogo Select Host que se muestra, seleccione los hosts a los que pertenece el rol y haga clic en OK.
  4. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 30 minutos antes y después del tiempo de generación de alarmas respectivamente. A continuación, haga clic en Download.
  5. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna