ALM-16008 El uso de memoria no heap del proceso Hive supera el umbral
Descripción
El sistema comprueba el estado del servicio Hive cada 30 segundos. La alarma se genera cuando el uso de memoria no heap de un servicio Hive excede el umbral (95% de la memoria máxima).
Los usuarios pueden elegir O&M > Alarm > Thresholds > Name of the desired cluster > Hive para cambiar el umbral.
La alarma se borra cuando el uso de memoria no heap es menor o igual que el umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrado automáticamente |
---|---|---|
16008 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el nombre del servicio para el que se genera la alarma. |
RoleName |
Especifica el nombre del rol para el que se genera la alarma. |
HostName |
Especifica el objeto (ID de host) para el que se genera la alarma. |
Impacto en el sistema
Cuando el uso de memoria no heap de Hive es excesivo, el rendimiento de la operación de tarea Hive se ve afectado. Además, puede producirse un desbordamiento de memoria para que el servicio Hive no esté disponible.
Causas posibles
La memoria no heap de la instancia de Hive en el nodo se utiliza en exceso o la memoria no heap se asigna de forma inadecuada. Como resultado, el uso excede el umbral.
Procedimiento
Verificar el uso de memoria no heap.
- En el portal del FusionInsight Manager, haga clic en O&M > Alarm > Alarms y seleccione la alarma cuyo Alarm ID is 16008. A continuación, compruebe el nombre del rol de Location y confirme la dirección IP de la instancia.
- En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Hive > Instance y haga clic en el HiveServer para el que se genera la alarma para ir a la página Dashboard. Haga clic en el menú desplegable en el área Chart y elija Customize > CPU and Memory y seleccione HiveServer Memory Usage Statistics y haga clic en OK y compruebe si la memoria no heap utilizada del servicio HiveServer alcanza el umbral (valor predeterminado: 95%) de la memoria no heap máxima especificada para HiveServer.
Figura 1 Estadísticas de uso de memoria de HiveServer
- En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Hive > Instance y haga clic en el MetaStore para el que se genera la alarma para ir a la página Dashboard. Haga clic en el menú desplegable en el área Chart y elija Customize > CPU and Memory y seleccione MetaStore Memory Usage Statistics y haga clic en OK y compruebe si la memoria no heap utilizada del servicio MetaStore alcanza el umbral (valor predeterminado: 95%) de la memoria no heap máxima especificada para MetaStore.
Figura 2 Estadísticas de uso de memoria de MetaStore
- En el portal del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Hive > Configurations > All Configurations. Elija HiveServer/MetaStore > JVM. Ajuste el valor de -XX:MaxMetaspaceSize en HIVE_GC_OPTS/METASTORE_GC_OPTS como las siguientes reglas. Haga clic en Save.
Sugerencias para la configuración de los parámetros de GC para el HiveServer:
- Se recomienda establecer el valor de -XX:MaxMetaspaceSize en 1/8 del valor de -Xmx. Por ejemplo, si -Xmx se establece en 2 GB, -XX:
MaxMetaspaceSize está establecido en 256 MB. Si -Xmx se establece en 4 GB, -XX:MaxMetaspaceSize se establece en 512 MB.
Sugerencias para la configuración de los parámetros de GC para el MetaServer:- Se recomienda establecer el valor de -XX:MaxMetaspaceSize en 1/8 del valor de -Xmx. Por ejemplo, si -Xmx se establece en 2 GB, -XX:
MaxMetaspaceSize está establecido en 256 MB. Si -Xmx se establece en 4 GB, -XX:MaxMetaspaceSize se establece en 512 MB.
- Se recomienda establecer el valor de -XX:MaxMetaspaceSize en 1/8 del valor de -Xmx. Por ejemplo, si -Xmx se establece en 2 GB, -XX:
- Haga clic en More > Restart Service para reiniciar el servicio.
- Verifique si la alarma se ha borrado.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 7.
Recopilar información de fallas.
- En el portal del FusionInsight Manager, elija O&M > Log > Download.
- Seleccione Hive en el clúster requerido en el Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna