ALM-16003 El uso de subprocesos en segundo plano supera el umbral
Descripción
El sistema comprueba el uso de subprocesos en segundo plano cada 30 segundos. Esta alarma se genera cuando el uso del grupo de subprocesos en segundo plano de Hive excede el umbral, 90% de forma predeterminada.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
16003 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger condition |
Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma. |
Impacto en el sistema
Hay demasiados subprocesos en segundo plano, por lo que la tarea recién enviada no puede ejecutarse a tiempo.
Causas posibles
- Hay muchas tareas ejecutadas en el grupo de subprocesos de fondo de HiveServer.
- La capacidad del grupo de subproceso de fondo de HiveServer es demasiado pequeña.
Procedimiento
Verificar la cantidad de tareas ejecutadas en el grupo de subprocesos en segundo plano de HiveServer.
- En el portal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Hive. En la página mostrada, haga clic en HiveServer Instance y compruebe los valores de Background Thread Count y Background Thread Usage.
Figura 1 Fondo
- Compruebe si el número de subprocesos de fondo en la última media hora es excesivamente alto. (Por defecto, el número de cola es 100, y el número de subproceso se considera como alto si es 90 o más.)
- Ajuste el número de tareas enviadas al grupo de subprocesos en segundo plano. (Por ejemplo, cancele algunas tareas que consumen mucho tiempo con bajo rendimiento.)
- Compruebe si los valores de Recuento de subprocesos en segundo plano y Uso de subprocesos en segundo plano disminuyen.
Comprobar la capacidad del grupo de subprocesos de fondo de HiveServer.
- En el portal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Hive. En la página mostrada, haga clic en HiveServer Instance y compruebe los valores de Background Thread Count y Background Thread Usage.
Figura 2 Fondo
- Aumente el valor de hive.server2.async.exec.threads en el archivo ${BIGDATA_HOME}/FusionInsight_HD_/1_23_HiveServer/etc/hive-site.xml. Por ejemplo, aumente el valor en un 20%.
- Guarde la modificación.
- Verifique si la alarma se ha borrado.
- Si lo es, no se requiere ninguna otra acción.
- Si no es así, vaya a 9.
Recopilar información de fallas.
- En el portal del FusionInsight Manager, elija O&M > Log > Download.
- Seleccione Hive en el clúster requerido en el Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna