文档首页/ 云容器引擎 CCE/ 常见问题/ 工作负载/ 工作负载异常问题排查/ 挂载文件存储的节点,Pod创建删除卡死
更新时间:2024-11-13 GMT+08:00

挂载文件存储的节点,Pod创建删除卡死

故障现象

在挂载文件存储(SFS或SFS Turbo)的节点上,删除Pod卡在“结束中”,创建Pod卡在“创建中”。

可能原因

  • 后端文件存储被删除,导致无法访问挂载点。
  • 节点与文件存储间网络异常,导致无法访问挂载点。

解决方案

  1. 登录挂载文件存储的节点,执行如下命令找到文件存储挂载路径。

    findmnt

    挂载点路径示例:/mnt/paas/kubernetes/kubelet/pods/7b88feaf-71d6-4e6f-8965-f5f0766d9f35/volumes/kubernetes.io~csi/sfs-turbo-ls/mount

  2. 执行如下命令尝试进入文件存储文件夹。

    cd /mnt/paas/kubernetes/kubelet/pods/7b88feaf-71d6-4e6f-8965-f5f0766d9f35/volumes/kubernetes.io~csi/sfs-turbo-ls/mount

    如果不能正确进入,则说明文件存储被删除或文件存储与节点间网络异常。

  3. 执行umount -l 命令解除挂载。

    umount -l /mnt/paas/kubernetes/kubelet/pods/7b88feaf-71d6-4e6f-8965-f5f0766d9f35/volumes/kubernetes.io~csi/sfs-turbo-ls/mount

  4. 重启kubelet。

    systemctl restart kubelet

问题根因

该问题常见于文件存储挂载模式为hard的场景,在hard模式下,所有访问挂载点的进程都会Hang住,直到访问成功。使用soft模式挂载可以避免该情况,具体请参见设置挂载参数