更新时间:2024-11-06 GMT+08:00
工作负载异常:OOM问题
问题现象
若因OOM被终止的进程为容器的阻塞进程,可能会导致容器异常重启。
问题原因
容器不允许使用超过其限制的内存,超过后容器可能会被终 止,触发OOM(Out Of Memory)事件,导致容器异常退出。关于OOM事件,可以参考为容器和Pod分配内存资源。
解决方案
- 登录CCE控制台。
- 单击集群名称进入集群,在左侧选择“工作负载”。
- 单击工作负载操作列的“监控”,即可查看Pod的CPU、内存、网络I/O等监控大盘。
- 通过Pod内存监控查看内存增长曲线,确定异常出现时间。
- 根据监控、内存增长时间点、日志、进程名等信息,排查Pod内对应进程是否存在内存泄漏。
- 若OOM是进程内存泄漏导致,请您自行排查泄露原因。
- 若进程运行状态正常,则根据实际运行需要,适当增大Pod的内存限制,建议Pod的内存实际使用量不超过内存限制值的80%。具体操作,请参见设置容器规格。