ALM-24007 El uso de memoria directa del servidor Flume supera el umbral
Descripción
El sistema comprueba el uso directo de memoria del servicio Flume cada 60 segundos. Esta alarma se genera cuando el uso directo de memoria de la instancia Flume supera el umbral (80% de la memoria máxima) durante cinco veces consecutivas. Esta alarma se borra cuando el uso de memoria directa de Flume es menor o igual que el umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
24007 |
Importante |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
El desbordamiento de la memoria directa puede provocar una falla en el servicio.
Causas posibles
La memoria directa del proceso Flume se utiliza en exceso o la memoria directa se asigna de forma inadecuada.
Procedimiento
Comprobar el uso de la memoria directa.
- Inicie sesión en FusionInsight Manager y elija O&M. En el panel de navegación de la izquierda, elija Alarm > Alarms. En la página que se muestra, busque la fila que contiene Flume Direct Memory Usage Exceeds the Threshold y vea la información del Location. Compruebe el nombre del host para el que se genera la alarma.
- En FusionInsight Manager, seleccione Cluster > Name of the target cluster > Services > Flume. En la página que se muestra, haga clic en la pestaña Instance. En la pestaña mostrada, seleccione el rol correspondiente al nombre de host para el que se genera la alarma y seleccione Customize en la lista desplegable en la esquina superior derecha del área del gráfico. Elija Agent y seleccione Flume Direct Memory Resource Percentage. A continuación, haga clic en OK.
Figura 1 Estadísticas de uso de memoria directa de Flume
- Compruebe si la memoria directa utilizada por Flume alcanza el umbral (80% de la memoria directa máxima por defecto).
- En FusionInsight Manager, seleccione Cluster > Name of the desired cluster > Service > Flume > Configuration. En la página que se muestra, haga clic en All Configurations y elija Flume > System. Establezca -XX:MaxDirectMemorySize en el parámetro GC_OPTS a un valor mayor según los requisitos del sitio y guarde la configuración.
Si se genera esta alarma, el tamaño de memoria directa configurado para la instancia del servidor Flume no puede cumplir con los requisitos de servicio. Se recomienda cambiar el valor de -XX:MaxDirectMemorySize al doble del tamaño actual de memoria directa o cambiar el valor según los requisitos del sitio.
- Reinicie los servicios o instancias afectados y compruebe si la alarma está desactivada.
- De ser así, no se requiere ninguna acción adicional.
- Si no, vaya a 6.
Recopilar información de fallas.
- En FusionInsight Manager, seleccione O&M. En el panel de navegación de la izquierda, elija Log > Download.
- Expanda la lista desplegable Service y seleccione Flume para el clúster de destino.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 10 minutos antes y después del tiempo de generación de alarmas, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con y proporcione los registros recopilados.
Eliminación de alarmas
Esta alarma se borra automáticamente después de rectificar la falla.
Información relacionada
Ninguna