ALM-44004 Las tareas de cola de grupo de recursos de coordinador de Presto superan el umbral (Para MRS 2.x o anterior)
Descripción
Esta alarma se genera cuando el sistema detecta que el número de tareas de cola en un grupo de recursos excede el umbral. El sistema consulta el número de tareas de cola en un grupo de recursos a través de la interfaz JMX. Puede elegir Components > Presto > Service Configuration (cambiar Basic a All) > Presto > resource-groups para configurar un grupo de recursos. Puede elegir Components > Presto > Service Configuration (cambiar Basic a All) > Coordinator > Customize > resourceGroupAlarm para configurar el umbral de cada grupo de recursos.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
44004 |
Grave |
Sí |
Parámetro
Parámetro |
Descripción |
---|---|
ServiceName |
Servicio para el que se genera la alarma. |
RoleName |
Rol para el que se genera la alarma. |
HostName |
Host para el que se genera la alarma. |
Impacto en el sistema
Si el número de tareas de cola en un grupo de recursos excede el umbral, un gran número de tareas puede estar en el estado de cola. El tiempo de tarea de Presto supera el valor esperado. Cuando el número de tareas de cola en un grupo de recursos excede el número máximo (maxQueued) de tareas de cola en el grupo de recursos, no se pueden ejecutar nuevas tareas.
Causas posibles
La configuración del grupo de recursos es incorrecta o se envían demasiadas tareas en el grupo de recursos.
Procedimiento
- Seleccione Components > Presto > Service Configuration (cambiar Basic a All) > Presto > resource-groups para ajustar la configuración del grupo de recursos.
- Puede elegir Components > Presto > Service Configuration (cambiar Basic a All) > Coordinator > Customize > resourceGroupAlarm para modificar el umbral de cada grupo de recursos.
- Recopilar información de fallas.
- Inicie sesión en el nodo del clúster según el nombre del host en la información de error y consulte el número de tareas de cola según Resource Group en la información adicional del cliente de Presto.
- Inicie sesión en el nodo del clúster basándose en el nombre del host en la información de errores, vea el archivo /var/log/Bigdata/nodeagent/monitorlog/monitor.log y busque información del grupo de recursos para ver la información de recopilación de supervisión del grupo de recursos.
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna