更新时间:2026-03-18 GMT+08:00
分享

一键部署

  1. 两台昇腾云裸金属服务器任选其中一台服务器作为主节点,如下是环境变量的参数解释,主副节点变量值填写一致

    参数解释:

    • model_name:模型名称,参考表1表中的模型名称
    • required_cards:NPU卡的数量,参考表1表中的最小卡数(64G显存)
    • port:服务部署的端口,创建多个实例的时候避免端口冲突

    在服务器中执行如下命令:

    export model_name=根据变量解释填写
    export required_cards=根据变量解释填写
    export port=根据变量解释填写
    wget -P /home/ https://documentation-samples-17.obs.cn-north-9.myhuaweicloud.com/solution-as-code-publicbucket/solution-as-code-module/quickly-deploy-llm-on-modelarts-lite-devserver/userdata/deploy-large-models.sh && chmod 755 /home/deploy-large-models.sh && sh  /home/deploy-large-models.sh ${model_name} ${required_cards} ${port}

  2. 预计部署时间15分钟,当日志出现如下信息,表示模型部署成功,端口为步骤1定义的端口号。
  3. 参考本文档中的开通安全组章节,开放昇腾云机器对外提供访问端口的能力。

相关文档