更新时间:2024-04-30 GMT+08:00
分享

NFS服务安装与配置

NFS服务是ModelArts边缘资源池提供的数据存储卷服务,创建部署时可通过NFS挂载的方式访问共享数据,比如obs的模型文件。

涉及以下场景时,必须为资源池配置NFS服务:

  • 创建AI应用时,元模型来源选择“从对象存储服务(OBS)中选择”,且AI引擎选择“Custom”。
  • 创建部署时,数据存储使用NFS类型的存储卷。

安装NFS服务

  1. 登录存储节点。

    在边缘资源池中,选定一个节点作为存储节点。该节点提供NFS网盘服务,用于存放集群共享的文件。建议使用存储空间足够大(能存放下大模型文件)的节点作为存储节点。使用Putty工具登录存储节点。

    ssh <用户名>@<节点IP>
    • 用户名:登录服务器的用户名。
    • 节点IP:登录服务器的IP地址。若节点是云服务器,可在云服务器控制台中查询。
  2. 安装NFS。

    该步骤需要设备联网下载软件依赖包。

    • Ubuntu系统

      在线安装:

      sudo apt install nfs-kernel-server
    • Euler OS系统
      在线安装:
      sudo yum install nfs-utils
  3. 创建模型目录。

    该路径的存储空间能够存储大模型文件。

    mkdir -p /var/docker/hilens
  4. 添加访问权限。

    配置nfs-server访问白名单和文件存储路径。

    vim /etc/exports

    添加如下配置:

    /var/docker/hilens 192.168.0.0/24(rw,no_all_squash,anonuid=1000,anongid=100,fsid=0)

    192.168.0.0/24为集群内网IP网段(登录主控节点,使用ifconfig命令查看IP地址)。

  5. 加载配置。
    exportfs -rv
  6. 启动NFS和rpcbind。
    systemctl enable nfs-server && systemctl enable rpcbind && systemctl start rpcbind nfs-server
  7. 执行如下命令,验证以上配置内容是否正确。如下图,表示配置正确,即NFS服务安装成功。
    showmount -e localhost

ModelArts节点信息配置

  1. 登录主控节点的Linux机器。
    ssh <用户名>@<节点IP>
    • 用户名:登录服务器的用户名。
    • 节点IP:登录服务器的IP地址。若节点是云服务器,可在云服务器控制台中查询。
  2. 配置固件启动参数。
    vim /etc/hilens/hda.conf

    增加如下配置,“192.168.xxx.xxx”需要替换为您实际的NFS存储节点的内网IP:

    hilens.nfs.server.ip=192.168.xxx.xxx
    hilens.nfs.mount.dir=/home/mind/model
    hilens.nfs.source.dir=/var/docker/hilens

    参数说明:

    • hilens.nfs.server.ip :NFS存储节点的内网IP。
    • hilens.nfs.mount.dir:大模型默认挂载路径,即容器内访问路径,由镜像决定。
    • hilens.nfs.source.dir:大模型下载路径,即存储节点的共享目录。该目录必须先在/etc/exports中配置共享权限;否则会导致无权限挂载。
  3. 重启固件。
    systemctl restart hdad
分享:

    相关文档

    相关产品