¿Por qué los pods son desalojados por kubelet debido a estadísticas anormales de cgroup?
Síntoma
En un nodo de brazo, los pod son desalojados por kubelet debido a las estadísticas anormales de cgroup. Como resultado, el nodo funciona anormalmente.
kubelet sigue desalojando los pod. Después de que todos los contenedores están muertos, kubelet todavía considera que la memoria es insuficiente.
De hecho, el uso de recursos es normal.
El valor de usage_in_bytes de cgroup en el directorio /sys/fs/cgroup/memory es anormal.
# cd /sys/fs/cgroup/memory # cat memory.usage_in_bytes 17618837504
Causa posible
En un nodo Arm, el núcleo de EulerOS 2.8 y 2.9 tiene un error, que hace que kubelet desaloje los pods y resulta en la falta de disponibilidad del servicio.
![](https://support.huaweicloud.com/intl/es-us/cce_faq/public_sys-resources/note_3.0-es-us.png)
Este problema se ha resuelto en las siguientes versiones:
- EulerOS 2.8: kernel-4.19.36-vhulk1907.1.0.h1088.eulerosv2r8.aarch64
- EulerOS 2.9: kernel-4.19.90-vhulk2103.1.0.h539.eulerosv2r9.aarch64
Solución
- Si la versión de clúster es 1.19.16-r0, 1.21.7-r0, 1.23.5-r0, 1.25.1-r0 o posterior, restablezca el sistema operativo del nodo a la versión más reciente.
- Si la versión de clúster no cumple con los requisitos, actualice el clúster a la versión especificada y, a continuación, restablezca el sistema operativo del nodo a la versión más reciente.
Núcleo de nodos Preguntas frecuentes
- Cuando las aplicaciones se crean y eliminan repetidamente en un nodo de CentOS con una versión de kernel anterior, se produce una fuga de cgroup Kmem de vez en cuando
- Problemas causados por la configuración conn_reuse_mode en el modo de reenvío IPVS de clústeres de CCE
- ¿Por qué los pods son desalojados por kubelet debido a estadísticas anormales de cgroup?
- Cuando se produce OOM del contenedor en el nodo de CentOS con una versión anterior del kernel, el sistema de archivos Ext4 se suspende ocasionalmente
Comentarios
¿Le pareció útil esta página?
Deje algún comentariomore