更新时间:2024-10-14 GMT+08:00

节点挂载点检查异常处理

检查项内容

检查节点上是否存在不可访问的挂载点。

解决方案

问题场景:节点上存在不可访问的挂载点

节点存在不可访问的挂载点,通常是由于该节点或节点上的Pod使用了网络存储nfs(常见的nfs类型有obsfs、sfs等),且节点与远端nfs服务器断连,导致挂载点失效,所有访问该挂载点的进程均会出现D状态卡死。

  1. 登录节点。
  2. 节点上依次执行如下命令:

    - df -h
    - for dir in `df -h | grep -v "Mounted on" | awk "{print \\$NF}"`;do cd $dir; done && echo "ok"

  3. 若返回ok则无问题。

    否则,请另起一个终端执行如下命令,查询先前命令是否存在D状态:
    - ps aux | grep "D "

  4. 若发现进程存在D状态,则确认为该问题,目前可以通过重启节点解决。请选择一个合适的时间重启节点后,重试升级。

    重启节点会使原先运行在节点上的工作负载重新调度,请在重启节点前确认是否会对业务造成影响。