更新时间:2023-12-07 GMT+08:00

节点挂载点检查

检查项内容

检查节点上是否存在不可访问的挂载点。

解决方案

问题场景:节点上存在不可访问的挂载点

节点存在不可访问的挂载点,通常是由于该节点或节点上的Pod使用了网络存储nfs(常见的nfs类型有obsfs、sfs等),且节点与远端nfs服务器断连,导致挂载点失效,所有访问该挂载点的进程均会D住卡死。

  1. 登录节点。
  2. 节点上依次执行如下命令:

    - df -h
    - for dir in `df -h | grep -v "Mounted on" | awk "{print \\$NF}"`;do cd $dir; done && echo "ok"

  3. 若返回ok则无问题。

    否则,请另起一个终端执行如下命令,查询先前命令是否存在D状态:
    - ps aux | grep "D "

  4. 若发现进程存在D状态,则确认为该问题,目前只可以通过重置节点解决。请选择一个合适的时间重置节点后,重试升级。

    重置节点会重置所有节点标签,可能影响工作负载调度,请在重置节点前检查并保留您手动为该节点打上的标签。