创建多模态大模型部署任务
平台支持部署训练后的模型或预置模型,操作步骤如下:
- 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。
图1 我的空间
- 在左侧导航栏中选择“模型开发 > 模型部署”,单击界面右上角“创建部署”。
- 在“创建部署”页面,参考表1完成部署参数设置,启动模型部署。
表1 多模态大模型部署参数说明 参数分类
部署参数
参数说明
部署配置
选择模型
可以修改如下信息:
- 来源:选择“模型广场”或“我的资产”。来源:“模型广场”表示预置模型;“我的资产”表示经过训练发布的用户模型。
- 类型:选择“多模态模型”,并选择需要进行部署的模型和版本。
部署方式
云上部署:算法部署至平台提供的资源池中。
安全护栏
开启并同意授权
安全护栏保障模型调用安全。
版本选择
当前支持安全护栏基础版,内置了默认的内容审核规则。
资源配置
计费模式
限时免费。
实例数
设置部署模型是所需的实例数,单次部署服务时,部署实例个数建议不大于10,否则可能触发限流导致部署失败。
订阅提醒
订阅提醒
该功能开启后,平台支持两种订阅类型,预置通知和SMN通知。
预置通知:系统将在任务状态运行、失败或者告警时,通过短信或邮件将提醒发送给用户。
SMN通知:用户可在SMN云服务创建主题并维护订阅信息,在创建部署时选择对应主题以及需要通知的状态。训练状态范围:运行、失败、告警。
基本信息
服务名称
设置部署任务的名称。
描述(选填)
设置部署任务的描述。
标签(选填)
设置部署任务的标签,部署和更新模型时,以“SERVICE_TAGS_CONFIG”为key,标签信息的json体Base64字符串为value添加到模型服务的环境变量中。
- 参数填写完成后,单击“立即部署”。