更新时间:2023-12-07 GMT+08:00
节点挂载点检查
检查项内容
检查节点上是否存在不可访问的挂载点。
解决方案
问题场景:节点上存在不可访问的挂载点
节点存在不可访问的挂载点,通常是由于该节点或节点上的Pod使用了网络存储nfs(常见的nfs类型有obsfs、sfs等),且节点与远端nfs服务器断连,导致挂载点失效,所有访问该挂载点的进程均会D住卡死。
- 登录节点。
- 节点上依次执行如下命令:
- df -h - for dir in `df -h | grep -v "Mounted on" | awk "{print \\$NF}"`;do cd $dir; done && echo "ok"
- 若返回ok则无问题。
否则,请另起一个终端执行如下命令,查询先前命令是否存在D状态:
- ps aux | grep "D "
- 若发现进程存在D状态,则确认为该问题,目前只可以通过重置节点解决。请选择一个合适的时间重置节点后,重试升级。
重置节点会重置所有节点标签,可能影响工作负载调度,请在重置节点前检查并保留您手动为该节点打上的标签。
父主题: 升级前检查异常问题排查