更新时间:2024-08-29 GMT+08:00
分享

搭建边缘服务器集群

  1. 执行如下命令,生成docker证书。注意该命令只需执行一次,如果已有相关证书,请跳过该步骤。
    bash cluster_install-ascend.sh generate_docker_cert --pkg-path=/home/hilens/pkgs
  2. 基于边缘部署准备工作注册边缘资源池节点,按照以下目录结构存放下载文件,注意修改下载文件的命名。其中,docker下的certs证书会自动生成,一般无需修改。
    pkgs // 包目录,用户自行命名
        docker
            docker.tgz    // docker 二进制文件,要求版本>19.0.3
            certs         // 使用generate命令生成的证书,指定--pkg-path后会自动创建到certs目录
                ca.crt
                server.crt
                server.key
        k3s
            k3s // k3s可执行文件
            agent
                images
                    k3s-airgap-images-[arm64|amd64].tar.gz //k3s离线镜像
        hilens-agent
            hilens-agent.tgz // hilens agent固件包
            license.tgz // hilens 设备license
  3. 工作节点执行命令如下:
    bash -x cluster_install-ascend.sh --pkg-path=/home/hilens/pkgs --node-type=worker --host-ip=192.168.0.209

    主控节点执行命令如下:

    bash -x cluster_install-ascend.sh --pkg-path=/home/hilens/pkgs --node-type=controller --host-ip=192.168.0.150
    • cluster_install-ascend.sh脚本主要用于安装docker、hdad和k3s,请联系华为工程师获取。
    • pkg-path是步骤2中整合的安装包文件目录。
    • host-ip是设备在集群中的ip,一般为内网ip。
    • node-type是集群节点类型。其中,worker表示工作节点,controller表示主控节点。
  4. 在服务器执行如下命令,判断docker是否安装成功。
    systemctl status docker

  5. 在服务器执行如下命令,判断edge agent是否安装成功。
    hdactl info

  6. 配置hda.conf配置文件信息(可选)
    1. 登录nfs服务节点,执行如下命令:
      vi /etc/hilens/hda.conf
    2. 增加如下配置:
      hilens.nfs.server.ip=192.168.0.150
      hilens.nfs.mount.dir=/home/mind/model
      hilens.nfs.source.dir=/var/docker/hilens

      其中,server.ip是nfs存储节点内网ip,mount.dir是大模型默认挂载路径,source.dir是大模型下载路径。

    3. 配置完成后,执行如下命令重启固件:
      systemctl restart hdad
  7. 进入ModelArts服务,选择所需空间。进入“边缘资源池 > 节点”,在当前设备节点操作列单击“激活”,节点状态将从“未激活”转为“已激活”。

  8. 进入“边缘资源池 > 资源池”,单击“创建”。填写资源池名称,选择“ModelArts边缘节点”,在“主控节点”处单击“添加”,选择要添加的主控节点,单击“确定”。

  9. 在“工作节点”处单击“添加”,选择要添加的工作节点,单击“确定”。

  10. 单击“立即创建”,可在资源池列表中查看节点的状态。如果状态为“运行中”,则创建成功。

  11. 在主控节点执行如下k8s命令,验证边缘池创建结果:
    1. 执行如下命令建立软连接。
      ln -s /home/k3s/k3s /usr/bin/kubectl
    2. 执行如下命令查看节点状态。
      kubectl get node -o wide
    3. 如果所有节点状态STATUS为“Ready”,则说明集群创建成功。

相关文档