ALM-18009 El uso de memoria heap de MapReduce JobHistoryServer supera el umbral (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el uso de memoria de pila de MapReduce JobHistoryServer cada 30 segundos y compara el uso real con el umbral. La alarma se genera cuando el uso de memoria heap de MapReduce JobHistoryServer excede el umbral (80% de la memoria máxima por defecto).
Para cambiar el umbral, elija System > Threshold Configuration > Service > MapReduce. La alarma se borra cuando el uso de memoria heap es menor o igual que el umbral.
Atributo
ID de alarma |
Severidad de alarma |
Borrado automáticamente |
---|---|---|
18009 |
Grave |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
Cuando el uso de memoria heap de JobHistoryServer de MapReduce es excesivo, el rendimiento del archivo de registros de MapReduce se ve afectado. Además, se produce un desbordamiento de memoria de modo que el servicio Yarn no está disponible.
Causas posibles
La memoria heap de la instancia de JobHistoryServer de MapReduce en el nodo se utiliza en exceso o la memoria heap se asigna de forma inadecuada. Como resultado, el uso excede el umbral.
Procedimiento
- Compruebe el uso de la memoria heap.
- Vaya a la página de detalles del clúster y elija Alarms.
- Seleccione la alarma cuyo Alarm ID sea 18009 y vea la dirección IP y el nombre del rol de la instancia de Location.
- Elija Components > MapReduce > Instance > JobHistoryServer (dirección IP de la instancia para la que se genera la alarma) > Customize > JobHistoryServer Heap Memory Usage Statistics. Compruebe el uso de la memoria heap.
- Compruebe si el uso de memoria heap de JobHistoryServer ha alcanzado el umbral (80% de la memoria heap máxima).
- Elija Components >MapReduce >Service Configuration. Establezca Type en All y elija JobHistoryServer >System. Aumente el valor de -Xmx en el parámetro GC_OPTS según sea necesario, haga clic en Save Configuration y seleccione Restart the affected services or instances. Haga clic en OK.
- Verifique si la alarma se ha borrado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 2.
- Recopilar información de fallas.
- En MRS Manager, seleccione .
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna