更新时间:2024-11-13 GMT+08:00
挂载文件存储的节点,Pod创建删除卡死
故障现象
在挂载文件存储(SFS或SFS Turbo)的节点上,删除Pod卡在“结束中”,创建Pod卡在“创建中”。
可能原因
- 后端文件存储被删除,导致无法访问挂载点。
- 节点与文件存储间网络异常,导致无法访问挂载点。
解决方案
- 登录挂载文件存储的节点,执行如下命令找到文件存储挂载路径。
findmnt
挂载点路径示例:/mnt/paas/kubernetes/kubelet/pods/7b88feaf-71d6-4e6f-8965-f5f0766d9f35/volumes/kubernetes.io~csi/sfs-turbo-ls/mount
- 执行如下命令尝试进入文件存储文件夹。
cd /mnt/paas/kubernetes/kubelet/pods/7b88feaf-71d6-4e6f-8965-f5f0766d9f35/volumes/kubernetes.io~csi/sfs-turbo-ls/mount
如果不能正确进入,则说明文件存储被删除或文件存储与节点间网络异常。
- 执行umount -l 命令解除挂载。
umount -l /mnt/paas/kubernetes/kubelet/pods/7b88feaf-71d6-4e6f-8965-f5f0766d9f35/volumes/kubernetes.io~csi/sfs-turbo-ls/mount
- 重启kubelet。
systemctl restart kubelet
问题根因
该问题常见于文件存储挂载模式为hard的场景,在hard模式下,所有访问挂载点的进程都会Hang住,直到访问成功。使用soft模式挂载可以避免该情况,具体请参见设置挂载参数。