Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Guía de operación de MRS Manager (Aplicable a versiones 2.x y anteriores)/ Referencia de alarma (aplicable a versiones anteriores a MRS 3.x)/ ALM-44004 Las tareas de cola de grupo de recursos de coordinador de Presto superan el umbral (Para MRS 2.x o anterior)
Actualización más reciente 2023-11-20 GMT+08:00

ALM-44004 Las tareas de cola de grupo de recursos de coordinador de Presto superan el umbral (Para MRS 2.x o anterior)

Descripción

Esta alarma se genera cuando el sistema detecta que el número de tareas de cola en un grupo de recursos excede el umbral. El sistema consulta el número de tareas de cola en un grupo de recursos a través de la interfaz JMX. Puede elegir Components > Presto > Service Configuration (cambiar Basic a All) > Presto > resource-groups para configurar un grupo de recursos. Puede elegir Components > Presto > Service Configuration (cambiar Basic a All) > Coordinator > Customize > resourceGroupAlarm para configurar el umbral de cada grupo de recursos.

Atributo

ID de alarma

Gravedad de la alarma

Borrar automáticamente

44004

Grave

Parámetro

Parámetro

Descripción

ServiceName

Servicio para el que se genera la alarma.

RoleName

Rol para el que se genera la alarma.

HostName

Host para el que se genera la alarma.

Impacto en el sistema

Si el número de tareas de cola en un grupo de recursos excede el umbral, un gran número de tareas puede estar en el estado de cola. El tiempo de tarea de Presto supera el valor esperado. Cuando el número de tareas de cola en un grupo de recursos excede el número máximo (maxQueued) de tareas de cola en el grupo de recursos, no se pueden ejecutar nuevas tareas.

Causas posibles

La configuración del grupo de recursos es incorrecta o se envían demasiadas tareas en el grupo de recursos.

Procedimiento

  1. Seleccione Components > Presto > Service Configuration (cambiar Basic a All) > Presto > resource-groups para ajustar la configuración del grupo de recursos.
  2. Puede elegir Components > Presto > Service Configuration (cambiar Basic a All) > Coordinator > Customize > resourceGroupAlarm para modificar el umbral de cada grupo de recursos.
  3. Recopilar información de fallas.

    1. Inicie sesión en el nodo del clúster según el nombre del host en la información de error y consulte el número de tareas de cola según Resource Group en la información adicional del cliente de Presto.
    2. Inicie sesión en el nodo del clúster basándose en el nombre del host en la información de errores, vea el archivo /var/log/Bigdata/nodeagent/monitorlog/monitor.log y busque información del grupo de recursos para ver la información de recopilación de supervisión del grupo de recursos.
    3. Póngase en contacto con el personal de O&M y envíe los registros recopilados.

Referencia

Ninguna