ALM-18008 Uso de memoria de Heap de Yarn ResourceManager supera el umbral (Para MRS 2.x o anterior)
Descripción
El sistema comprueba el uso de memoria heap de ResourceManager de Yarn cada 30 segundos y compara el uso real con el umbral. La alarma se genera cuando el uso de memoria heap de Yarn ResourceManager excede el umbral (80% de la memoria máxima por defecto).
Para cambiar el umbral, elija System > Threshold Configuration > Service > Yarn. La alarma se borra cuando el uso de memoria heap es menor o igual que el umbral.
Atributo
ID de alarma |
Severidad de alarma |
Borrar automáticamente |
---|---|---|
18008 |
Grave |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger Condition |
Especifica el umbral para activar la alarma. |
Impacto en el sistema
Cuando el uso de memoria heap de Yarn ResourceManager es demasiado alto, el rendimiento del envío y la operación de la tarea de Yarn se ve afectado. Además, se produce un desbordamiento de memoria de modo que el servicio Yarn no está disponible.
Causas posibles
La memoria heap de la instancia de Yarn ResourceManager en el nodo se utiliza en exceso o la memoria heap se asigna de forma inapropiada. Como resultado, el uso excede el umbral.
Procedimiento
- Compruebe el uso de la memoria heap.
- Vaya a la página de detalles del clúster de MRS y elija Alarms.
- Seleccione la alarma cuyo Alarm ID sea 18008 y vea la dirección IP y el nombre del rol de la instancia en Location.
- Elija Components > Yarn > Instances > ResourceManager (dirección IP de la instancia para la que se genera la alarma) > Customize > Percentage of Used Heap Memory of the ResourceManager. Compruebe el uso de la memoria heap.
- Compruebe si el uso de memoria heap de ResourceManager ha alcanzado el umbral (80% de la memoria máxima).
- Elija Components >Yarn >Service Configuration. Establezca Type en All y elija ResourceManager >System. Cambie los valores de -Xmx y -Xms en el parámetro GC_OPTS según los requisitos del sitio para asegurarse de que el valor de -Xms es menor que el de -Xmx. Haga clic en Save Configuration y seleccione Restart Role Instance. Haga clic en OK.
- Verifique si la alarma se ha borrado.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 2.
- Recopilar información de fallas.
- En MRS Manager, seleccione .
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna