ALM-18003 NodeManager de mal funcionamiento (para MRS 2.x o anterior)
Descripción
El sistema comprueba el número de nodos anormales de NodeManager cada 30 segundos y compara el número de nodos anormales con el umbral. El indicador Unhealthy Nodes tiene un umbral predeterminado. Esta alarma se genera cuando el valor del indicador Unhealthy Nodes excede el umbral.
Esta alarma se borra cuando el valor de Unhealthy Nodes es menor o igual que el umbral.
Atributo
ID de alarma |
Gravedad de la alarma |
Borrar automáticamente |
---|---|---|
18003 |
Grave |
Sí |
Parámetros
Parámetro |
Descripción |
---|---|
ServiceName |
Especifica el servicio para el que se genera la alarma. |
RoleName |
Especifica el rol para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Trigger condition |
Genera una alarma cuando el valor real del indicador excede el umbral especificado. |
Impacto en el sistema
- El nodo de NodeManager defectuoso no puede proporcionar el servicio Yarn.
- El número de contenedores disminuye, por lo que el rendimiento del clúster se deteriora.
Causas posibles
- El espacio en disco del host donde reside el nodo NodeManager es insuficiente.
- El usuario omm no tiene permiso para acceder a un directorio local en el nodo de NodeManager.
Procedimiento
- Recopile información de fallas.
- En MRS Manager, elija System > Export Log.
- Póngase en contacto con el personal de O&M y envíe los registros recopilados.
Referencia
Ninguna