Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-11-20 GMT+08:00

ALM-18006 Tiempo de espera de ejecución de trabajos de MapReduce (Para MRS 2.x o anterior)

Descripción

El módulo de alarma comprueba la ejecución del trabajo de MapReduce cada 30 segundos. Esta alarma se genera cuando se agota el tiempo de ejecución de un trabajo de MapReduce enviado.

Esta alarma debe borrarse manualmente.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

18006

Grave

No

Parámetros

Parámetro

Descripción

ServiceName

Especifica el servicio para el que se genera la alarma.

RoleName

Especifica el rol para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Trigger condition

Genera una alarma cuando el valor real del indicador excede el umbral especificado.

Impacto en el sistema

Se agota el tiempo de ejecución del trabajo de MapReduce enviado, por lo que no se puede obtener ningún resultado de ejecución. Ejecute el trabajo de nuevo después de rectificar la falla.

Causas posibles

Lleva mucho tiempo ejecutar un trabajo de MapReduce. Sin embargo, el tiempo especificado es menor que el tiempo de ejecución requerido.

Procedimiento

  1. Comprueba si el tiempo está ajustado incorrectamente.

    Establezca -Dapplication.timeout.interval en un valor mayor o no establezca el parámetro. Compruebe si el trabajo de MapReduce se puede ejecutar.
    • En caso afirmativo, vaya a 2.e.
    • Si no, vaya a 2.b.

  2. Compruebe el estado de Yarn.

    1. Vaya a la página de detalles del clúster y elija Alarms.
    2. En la lista de alarmas de MRS Manager, compruebe si se genera la alarma ALM-18000 servicio Yarn no disponible.
      • En caso afirmativo, vaya a 2.c.
      • Si no, vaya a 3.
    3. Rectificar la falla siguiendo el procedimiento de tratamiento de ALM-18000 Servicio de Yarn no disponible (Para MRS 2.x o anterior).
    4. Vuelva a ejecutar el comando de trabajo de MapReduce para comprobar si se puede ejecutar el trabajo de MapReduce.
      • En caso afirmativo, vaya a 2.e.
      • Si no, vaya a 4.
    5. En la lista de alarmas, haga clic en en la columna Operation de la alarma para borrarla manualmente. No se requiere ninguna otra acción.

  3. Ajuste el umbral de tiempo de espera.

    En MRS Manager, elija System > Threshold Configuration > Services > Yarn > Timed out Applications y aumente el número máximo de tareas de tiempo de espera permitidas por la regla de umbral actual. Verifique si la alarma se ha borrado.
    • De ser así, no se requiere ninguna acción adicional.
    • Si no, vaya a 4.

  4. Recopile información de fallas.

    1. En MRS Manager, seleccione System > Export Log.
    2. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Referencia

Ninguna