更新时间:2025-10-14 GMT+08:00
分享

FAQ

K8s master节点重启

问题现象:K8s master节点重启后,POD存在UnexpectedAdmissionError状态,且服务无法正常启动。

解决方法:需要在K8s master节点重启恢复后重启Volcano等组件,并重启业务实例。

镜像通过docker load到本地节点后,启动提示ImagePullBackOff

问题现象:在本地节点通过docker load命令将获取到的镜像tar文件load到本地,但启动失败提示拉取不到镜像。

解决方法:通过执行下述命令load镜像

ctr --address=/root/kubernetes/run/containerd/containerd.sock -n k8s.io images import ${镜像tar包路径}

业务容器频繁重启,且没有生成错误日志

如果日志都没有生成,且不是镜像拉取的问题,参考报错如下,那么需要考虑是不是脚本的问题,部署脚本的位置根据配置的这个--script-path参数指定,脚本无法执行分为下面三种情况:

  • 脚本目录不正确

    首先查询当前K8s纳管的节点,然后登录到每个节点上,到--script-path参数指定的位置确认是否存在部署脚本及权重文件,并且是否正确挂载进Pod,需要在Pod内执行部署脚本。

  • 脚本权限不正确
    需要确认脚本要有可执行权限,如果脚本没有可执行权限,可以用以下命令修改脚本权限。
    chmod -R 750 /mnt/deepseek/deploy/
  • 脚本文件格式不正确
    还有一种情况是 Shell 脚本的文件格式存在问题,可以用以下命令将文件格式转为Unix的LF格式
    dos2unix /mnt/deepseek/deploy/*

相关文档