更新时间:2024-10-14 GMT+08:00
节点挂载点检查异常处理
检查项内容
检查节点上是否存在不可访问的挂载点。
解决方案
问题场景:节点上存在不可访问的挂载点
节点存在不可访问的挂载点,通常是由于该节点或节点上的Pod使用了网络存储nfs(常见的nfs类型有obsfs、sfs等),且节点与远端nfs服务器断连,导致挂载点失效,所有访问该挂载点的进程均会出现D状态卡死。
- 登录节点。
- 节点上依次执行如下命令:
- df -h - for dir in `df -h | grep -v "Mounted on" | awk "{print \\$NF}"`;do cd $dir; done && echo "ok"
- 若返回ok则无问题。
否则,请另起一个终端执行如下命令,查询先前命令是否存在D状态:
- ps aux | grep "D "
- 若发现进程存在D状态,则确认为该问题,目前可以通过重启节点解决。请选择一个合适的时间重启节点后,重试升级。
重启节点会使原先运行在节点上的工作负载重新调度,请在重启节点前确认是否会对业务造成影响。
父主题: 升级前检查异常问题排查