ALM-43011 El uso de memoria no heap del proceso de JDBCServer2x supera el umbral
Descripción
El sistema comprueba el estado del proceso JDBCServer2x cada 30 segundos. La alarma se genera cuando el uso de memoria no heap de un proceso JDBCServer2x excede el umbral (95% de la memoria máxima).
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
43011 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el nombre del servicio para el que se genera la alarma. |
RoleName |
Especifica el nombre del rol para el que se genera la alarma. |
HostName |
Especifica el objeto (ID de host) para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral que activa la alarma. Si el valor del indicador actual excede este umbral, se genera la alarma. |
Impacto en el sistema
Si la memoria no heap de proceso de JDBCServer2x disponible es insuficiente, se produce un desbordamiento de memoria y el servicio se interrumpe.
Causas posibles
La memoria no heap del proceso JDBCServer2x se utiliza en exceso o la memoria no heap se asigna de forma inadecuada.
Procedimiento
Verificar el uso de memoria no heap.
- En el portal del FusionInsight Manager, seleccione O&M > Alarm > Alarms y seleccione la alarma cuyo ID es 43011. Compruebe el RoleName en Location y confirme la dirección IP de HostName.
- En el portal del FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Spark2x > Instance y haga clic en el JDBCServer2x para el que se genera la alarma para ir a la página Dashboard. Haga clic en el menú desplegable en el área Chart y elija Customize > Memory > JDBCServer2x Memory Usage Statistics en el cuadro de lista desplegable en la esquina superior derecha y haga clic en OK. Compruebe si la memoria no heap utilizada del proceso de JDBCServer2x alcanza el umbral (valor predeterminado es 95%) de la memoria no heap máxima especificada para JDBCServer2x.
Figura 1 Estadísticas de uso de memoria de JDBCServer2x
- En la página de inicio del FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Services > Spark2x > Instance. Haga clic en JDBCServer2x por la que se informa que la alarma va a la página Dashboard y haga clic en la lista desplegable en la esquina superior derecha del área del gráfico, elija Customize > Memory > Statistics for the non-heap memory of the JDBCServer2x Process y haga clic en OK. En base al tiempo de generación de alarma, compruebe los valores de la memoria no heap utilizada del proceso JDBCServer2x en el período correspondiente y obtenga el valor máximo.
Figura 2 Estadísticas para la memoria no heap del proceso JDBCServer2x
- En el portal de FusionInsight Manager, elija Cluster > Name of the desired cluster > Services > Spark2x > Configurations y haga clic en All Configurations. Elija JDBCServer2x > Tuning. Puede cambiar el valor de -XX: MaxMetaspaceSize en spark.driver.extraJavaOptions de acuerdo con las siguientes reglas: La relación entre el valor máximo de la memoria no heap utilizada por JDBCServer2x y Threshold de JDBCServer2x Non-Heap Memory Usage Statistics ( JDBCServer2x) en el período de alarma.
En la página de inicio del FusionInsight Manager, elija O&M > Alarm > Thresholds > Name of the desired cluster > Spark2x > Memory > JDBCServer2x Non-Heap Memory Usage Statistics (JDBCServer2x) para ver Threshold.
- Reinicie todas las instancias de JDBCServer2x.
- Después de 10 minutos, compruebe si la alarma está borrada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 7.
Recopilar información de fallas.
- En el portal del FusionInsight Manager, elija O&M > Log >Download.
- Seleccione Spark2x en el clúster requerido en el Service.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con el y envíe los registros recopilados.
Eliminación de alarmas
Después de rectificar la falla, el sistema borra automáticamente esta alarma.
Información relacionada
Ninguna