更新时间:2024-01-23 GMT+08:00
分享

部署服务

模型准备完成后,您可以部署服务,开发属于自己的文本分类应用,此应用用于分类自己所上传的文字内容,也可直接调用对应的API。

前提条件

  • 已在自然语言处理套件控制台选择“通用文本分类工作流”新建应用,并评估模型,详情请见评估模型
  • 由于部署服务涉及ModelArts功能,需消耗资源,要确保账户未欠费。
  • 如果部署服务使用专属资源池,需要在ModelArts创建专属资源池。

操作步骤

“服务部署”页面,按表1填写服务的相关参数,然后单击右下角的“部署”

图1 服务部署
表1 服务部署参数说明

参数

说明

服务名称

待部署的服务名称,首次部署服务请单击可修改默认服务名称。

如果在不同版本非首次部署服务,服务名称不支持修改。

描述

待部署服务的简要说明。

资源池

用于部署服务的资源池和资源类型。资源池可选“公共资源池”和“专属资源池”。

  • “公共资源池”提供公共的大规模计算集群,资源按作业隔离。您可以按需选择不同的资源类型。
  • “专属资源池”提供独享的计算资源不与其他用户共享,更加高效。使用专属资源池需要在ModelArts创建专属资源池。

计算节点规格

支持选择如下计算规格:

  • “CPU:2 核 8 GiB”:适合纯CPU类型的负载运行的模型。
  • “CPU+GPU:2 核 8 GiB + P4”:适合CPU+GPU类型模型的运行,带有1个Nvidia P4卡。

服务自动停止

设置服务自动停止的时间,在线服务运行状态在所选的时间点后自动停止,同时在线服务也停止计费。

计算节点个数

设置当前版本模型的实例个数。如果节点个数设置为1,表示后台的计算模式是单机模式;如果节点个数设置大于1,表示后台的计算模式为分布式的。请根据实际编码情况选择计算模式。

部署成功后,页面显示“服务部署成功”。您可以单击“查看应用监控”,进入应用监控页面查看监控信息,详情请见监控应用

分享:

    相关文档

    相关产品