更新时间:2025-11-26 GMT+08:00
分享

部署Deepseek大模型

模型训练完成后,可以启动模型的部署操作。

  1. 登录ModelArts Studio平台进入所需空间。
  2. 在左侧导航栏中选择“模型开发 > 模型部署”,单击界面右上角“创建部署”。
  3. 在“选择模型”页面,选择“模型广场 > 大语言模型 > 模型”,单击“确定”进入“创建部署”页面。
  4. 在“创建部署”页面,参考表1完成部署参数设置,启动模型部署。
    表1 三方大模型部署参数说明

    参数分类

    部署参数

    参数说明

    部署配置

    选择模型

    可以修改如下信息:

    • 来源:选择“模型广场”。
    • 类型:选择“大语言模型”,并选择需要进行部署的模型和版本。

    部署方式

    云上部署:算法部署至平台提供的资源池中。

    Deployed_model

    通过V2版本推理接口调用该推理服务时的唯一标识。

    安全护栏

    开启并同意授权

    安全护栏保障模型调用安全。

    版本选择

    当前支持安全护栏基础版,内置了默认的内容审核规则。

    资源配置

    计费模式

    选择训练当前任务的计费模式。

    实例数

    设置部署模型是所需的实例数,单次部署服务时,部署实例个数建议不大于10,否则可能触发限流导致部署失败。

    订阅提醒

    订阅提醒

    该功能开启后,平台支持两种订阅类型,预置通知和SMN通知。

    预置通知:系统将在任务状态运行、失败或者告警时,通过短信或邮件将提醒发送给用户。

    SMN通知:用户可在SMN云服务创建主题并维护订阅信息,在创建部署时选择对应主题以及需要通知的状态。训练状态范围:运行、失败、告警。

    基本信息

    服务名称

    设置部署任务的名称。

    描述(可选)

    设置部署任务的描述。

    标签(可选)

    设置部署任务的标签,部署和更新模型时,以“SERVICE_TAGS_CONFIG”为key,标签信息的json体Base64字符串为value添加到模型服务的环境变量中。

  5. 参数填写完成后,单击“立即部署”。

相关文档