更新时间:2025-01-06 GMT+08:00

诊断项及修复方案

集群诊断项及修复方案

Pod诊断项及修复方案

表1 Pod诊断项及修复方案

诊断项

修复方案

FailedScheduling

Insufficient memory

节点可分配内存不足,请扩容节点。

Insufficient cpu

节点可分配CPU不足,请扩容节点。

skip schedule deleting pod

Pod正在删除中。

其他信息

Pod调度失败,执行查看Pod信息。

kubectl describe <pod-name>

FailedAttachVolume

请检查Everest插件状态和节点网络连接,同时确保节点具有正确的权限。

FailedMount

请检查Everest插件状态和节点网络连接,同时确保节点具有正确的权限。

InvalidDiskCapacity

请检查节点的磁盘容量设置和实际可用空间,确保磁盘容量设置正确且满足应用程序或服务的需求。清理不必要的文件以释放磁盘空间。如果是动态卷,确保存储后端配置正确且可用。根据需要扩展磁盘容量或调整应用程序或服务的存储需求。

BackOffPullImage

请检查镜像URL是否正确。

FailedPullImage

请检查镜像URL是否正确。

ErrImageNeverPull

请检查本地镜像,建议将镜像拉取策略设置为IfNotPresent或Always。

InspectFailed

请检查镜像的完整性。

FailedPostStartHook

请检查后启动钩子的配置和脚本,确保其正确性。查看钩子执行的日志以获取错误信息,并根据错误信息修复钩子脚本中的问题。如果可能,尝试手动执行后启动钩子脚本以查看是否存在环境或权限问题。

FailedPreStopHook

请检查预停止钩子的配置和脚本,确保其正确性。查看钩子执行的日志以获取错误信息,并根据错误信息修复钩子脚本中的问题。如果可能,尝试手动执行预停止钩子脚本以查看是否存在环境或权限问题。

ProbeWarning

请检查探针配置,确保探针设置正确并能正确评估容器的健康状态。查看告警消息,确定可能的问题,并根据需要调整探针配置或修复容器中的问题。

Unhealthy

请检查Pod或容器的日志以查找错误信息。确保应用程序或服务在容器中正确启动和运行。检查容器资源使用情况以确定是否存在资源不足问题。根据日志和监控信息采取相应措施,如重启Pod或容器,修复应用程序或服务问题。

FailedCreatePodContainer

检查Pod和容器配置确保YAML配置文件正确无误,包括容器镜像、资源请求和限制等。

Preempting

建议为负载设置合理的资源请求和限制,避免因资源不足而触发抢占。

Killing

检查资源使用情况,确保Pod和节点的资源请求和限制设置合理,避免资源不足导致容器被终止。