ALM-16006 El uso de la memoria directa del proceso Hive supera el umbral
Descripción
El sistema comprueba el estado del servicio Hive cada 30 segundos. La alarma se genera cuando el uso de memoria directa de un servicio Hive supera el umbral (95% de la memoria máxima).
Los usuarios pueden elegir O&M > Alarm > Thresholds > Name of the desired cluster > Hive para cambiar el umbral.
La alarma se borra cuando el uso directo de memoria es menor o igual que el umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
16006 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el nombre del servicio para el que se genera la alarma. |
RoleName |
Especifica el nombre del rol para el que se genera la alarma. |
HostName |
Especifica el objeto (ID de host) para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma. |
Impacto en el sistema
Cuando el uso de memoria directa de Hive es excesivo, el rendimiento de la operación de tarea Hive se ve afectado. Además, puede producirse un desbordamiento de memoria para que el servicio Hive no esté disponible.
Causas posibles
La memoria directa de la instancia de Hive en el nodo se utiliza en exceso o la memoria directa se asigna de forma inapropiada. Como resultado, el uso excede el umbral.
Procedimiento
Comprobar el uso de memoria directa.
- En el portal del Administrador FusionInsight, haga clic en O&M > Alarm > Alarms y seleccione la alarma cuyo Alarm ID es 16006. A continuación, compruebe el nombre del rol de Location y confirme la dirección IP de la instancia.
- En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Hive > Instance y haga clic en el HiveServer para el que se genera la alarma para ir a la página Dashboard. Haga clic en el menú desplegable en el área Chart y elija Customize > CPU and Memory y seleccione HiveServer Memory Usage Statistics y haga clic en OK y compruebe si la memoria directa utilizada del servicio HiveServer alcanza el umbral (valor predeterminado: 95%) de la memoria directa máxima especificada para HiveServer.
Figura 1 Estadísticas de uso de memoria de HiveServer
- En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Hive > Instance y haga clic en el MetaStore para el que se genera la alarma para ir a la página Dashboard. Haga clic en el menú desplegable en el área Chart y elija Customize > CPU and Memory y seleccione MetaStore Memory Usage Statistics y haga clic en OK y compruebe si la memoria directa utilizada del servicio MetaStore alcanza el umbral (valor predeterminado: 95%) de la memoria directa máxima especificada para MetaStore.
Figura 2 Estadísticas de uso de memoria de MetaStore
- En el portal del FusionInsight Manager, seleccione Cluster >Name of the desired cluster > Services > Hive > Configurations > All Configurations. Elija HiveServer/MetaStore > JVM. Ajuste el valor de -XX:MaxDirectMemorySize en HIVE_GC_OPTS/METASTORE_GC_OPTS como las siguientes reglas. Haga clic en Save.
Sugerencias para la configuración de los parámetros de GC para el HiveServer:
- Se recomienda establecer el valor de -XX:MaxDirectMemorySize en 1/8 del valor de -Xmx. Por ejemplo, si -Xmx se establece en 8 GB, -XX:MaxDirectMemorySize se establece en 1024 MB. Si -Xmx se establece en 4 GB, -XX:MaxDirectMemorySize se establece en 512 MB. Se recomienda que el valor de -XX:MaxDirectMemorySize sea mayor o igual a 512 MB.
Sugerencias para la configuración de los parámetros de GC para el MetaServer:- Se recomienda establecer el valor de -XX:MaxDirectMemorySize en 1/8 del valor de -Xmx. Por ejemplo, si -Xmx se establece en 8 GB, -XX:MaxDirectMemorySize se establece en 1024 MB. Si -Xmx se establece en 4 GB, -XX:MaxDirectMemorySize se establece en 512 MB. Se recomienda que el valor de -XX:MaxDirectMemorySize sea mayor o igual a 512 MB.
- Haga clic en More > Restart Service para reiniciar el servicio.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 7.
Recopilar información de fallas.
- En el portal del FusionInsight Manager, elija O&M > Log > Download.
- Seleccione Hive en el clúster requerido en el Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros de fallas recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna