文档首页/ 魔坊（ModelArts）模型训推平台/ API参考/ 服务管理/ 部署服务 - CreateService

更新时间：2026-01-15 GMT+08:00

在线调试

CLI示例

查看PDF

部署服务 - CreateService

功能介绍

将模型部署为服务。

调试

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

授权信息

账号具备所有API的调用权限，如果使用账号下的IAM用户调用当前API，该IAM用户需具备调用API所需的权限。

如果使用角色与策略授权，具体权限要求请参见权限和授权项。

如果使用身份策略授权，需具备如下身份策略权限。

授权项	访问级别	资源类型（*为必须）	条件键	别名	依赖的授权项
modelarts:service:create	Write	-	g:RequestTag/<tag-key> g:TagKeys	-	-

URI

POST /v1/{project_id}/services

表1 路径参数
参数	是否必选	参数类型	描述
project_id	是	String	用户项目ID。获取方法请参见获取项目ID和名称。

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	是	String	用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。

表3 请求Body参数
参数	是否必选	参数类型	描述
workspace_id	否	String	服务所属的工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。
schedule	否	Array of Schedule objects	服务调度配置，仅在线服务可配置，默认不使用，服务长期运行。
cluster_id	否	String	可选，部署服务时使用的资源池ID。对于rel-time和batch服务类型，为旧版专属资源池ID，配置此参数后，则使用集群的网络配置，vpc_id参数不生效，使用专属资源池部署服务时需确保集群状态正常，若要使用专属资源池，需配置cluster_id或pool_name两个参数中任意一个，且pool_name优先级高于cluster_id，均不配置时则使用共享资源池，当与下方 config中的cluster_id或pool_name同时配置时，优先使用config中的cluster_id及pool_name参数；对于edge服务类型，为边缘资源池ID，使用边缘资源池部署服务时需确保资源池状态正常，当与下方 config中的cluster_id同时配置时，优先使用config中的cluster_id参数。
pool_name	否	String	real-time和batch服务类型可选。部署服务时使用的AI专属资源池弹性集群的资源池ID；使用专属资源池部署服务时需确保集群状态正常；当与下方 config中的cluster_id或pool_name同时配置时，优先使用config中的cluster_id及pool_name参数；若要使用专属资源池，需配置cluster_id或pool_name两个参数中任意一个，且pool_name优先级高于cluster_id，均不配置时则使用共享资源池。
infer_type	是	String	推理方式，取值为real-time/batch/edge。 real-time代表在线服务，将模型部署为一个Web batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智能边缘平台，在边缘节点将模型部署为一个Web Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 Service，需提前在IEF（智能边缘服务）创建好节点。
vpc_id	否	String	在线服务实例部署的虚拟私有云ID，默认为空，此时ModelArts会为每个用户分配一个专属的VPC，用户之间隔离；如需要在服务实例中访问名下VPC内的其他服务组件，则可配置此参数为对应VPC的ID。VPC一旦配置，不支持修改。当vpc_id与cluster_id一同配置时，只有专属资源池参数生效。
service_name	是	String	服务名称，支持1-64位字符，可包含字母、中文、数字、中划线、下划线。
description	否	String	服务描述，默认为空，不超过100个字符，不能包含!<>+&"'符号。
security_group_id	否	String	安全组，默认为空，当配置了vpc_id则此参数必填。安全组起着虚拟防火墙的作用，为服务实例提供安全的网络访问控制策略。安全组须包含至少一条入方向规则，对协议为TCP、源地址为0.0.0.0/0、端口为8080的请求放行。
subnet_network_id	否	String	子网的网络ID，默认为空，当配置了vpc_id则此参数必填。需填写虚拟私有云控制台子网详情中显示的“网络ID”。通过子网可提供与其他网络隔离的、可以独享的网络资源。
config	是	Array of ServiceConfig objects	模型运行配置，当推理方式为batch/edge时仅支持配置一个模型；当推理方式为real-time时，可根据业务需要配置多个模型并分配权重，但多个模型的版本号不能相同。
additional_properties	否	Map<String,ServiceAdditionalProperties>	服务级别附加属性，便于服务管理。
load_balancer_policy	否	String	只支持在线同步服务设置后端elb转发策略，枚举值：ROUND_ROBIN(加权轮询算法)，LEAST_CONNECTIONS(加权最少连接)，SOURCE_IP(源ip算法)
service_secrets	否	Array of ServiceSecret objects	服务挂载的密钥管理当中的密钥列表
priority	否	Integer	抢占优先级，取值范围[1， 3]，通过设置优先级保障高优先级的业务调度。infer_type为real-time、batch时支持抢占优先级设置。

表4 Schedule
参数	是否必选	参数类型	描述
duration	是	Integer	对应时间单位的数值，比如2小时后停止，则time_unit填HOURS，duration填2。
time_unit	是	String	调度时间单位，可选DAYS/HOURS/MINUTES。
type	是	String	调度类型，当前仅支持取值为stop，即运行指定时间后自动停止。

表5 ServiceConfig
参数	是否必选	参数类型	描述
custom_spec	否	CustomSpec object	自定义资源规格配置，仅当specification配置为custom时返回。
envs	否	Map<String,String>	公共参数。运行模型需要的环境变量键值对，可选填，默认为空。
specification	是	String	公共参数。资源规格，可通过查询支持的服务部署规格可获取规格列表。当前版本可选modelarts.vm.cpu.2u/modelarts.vm.gpu.pnt004(需申请)/modelarts.vm.ai1.snt3(需申请)/custom(仅支持在部署到专属资源池时使用)，需申请的规格请提交工单，由ModelArts运维工程师添加权限。若配置为custom，需同时指定custom_spec参数。
weight	否	Integer	real-time类型必选。权重百分比，分配到此模型的流量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。
deploy_timeout_in_seconds	否	Integer	单个模型实例部署的超时时间。
model_id	是	String	公共参数。模型ID。通过调用查询AI应用列表接口可以获取。
src_path	否	String	batch服务类型必选。批量任务输入数据的OBS路径。
req_uri	否	String	batch服务类型必选。批量任务中调用的推理接口，即模型镜像中暴露的REST接口，需要从模型的config.json文件中选取一个api路径用于此次推理；如使用ModelArts提供的预置推理镜像，则此接口为/。
mapping_type	否	String	batch服务类型必选。输入数据的映射类型，可选file或csv。选择file时，指每个推理请求对应到输入数据目录下的一个文件，当使用此方式时，此模型对应req_uri只能有一个输入参数且此参数的类型是file。选择csv时，指每个推理请求对应到csv里的一行数据，当使用此方式时，输入数据目录下的文件只能以.csv为后缀，且需配置mapping_rule参数，以表达推理请求体中各个参数对应到csv的索引。
cluster_id	否	String	可选，部署服务时使用的资源池ID。对于rel-time和batch服务类型，为旧版专属资源池ID，配置此参数后，则使用集群的网络配置，vpc_id参数不生效，使用专属资源池部署服务时需确保集群状态正常，该参数优先级低于pool_name，配置该参数时需要同时配置服务层级的cluster_id或pool_name参数，且该参数优先级高于服务层级的cluster_id及pool_name，当config内的cluster_id与pool_name均未配置时，会使用服务层级的cluster_id及pool_name参数，均不配置时则会使用共享资源池；对于edge服务类型，为边缘资源池ID，使用边缘资源池部署服务时需确保资源池状态正常，配置该参数时需要同时配置服务层级的cluster_id参数，且该参数优先级高于服务层级的cluster_id；当该参数未配置时，会使用服务层级的cluster_id参数。
pool_name	否	String	real-time和batch服务类型可选。部署服务时使用的AI专属资源池弹性集群的资源池ID，使用专属资源池部署服务时需确保集群状态正常；该参数优先级高于cluster_id，配置该参数时需要同时配置服务层级的cluster_id或pool_name参数，且该参数优先级高于服务层级的cluster_id及pool_name；当config内的cluster_id与pool_name均未配置时，会使用服务层级的cluster_id及pool_name参数，均不配置时则会使用共享资源池。
nodes	否	Array of strings	edge服务类型可选。边缘节点ID数组，节点ID为IEF（智能边缘平台）的边缘节点ID，在IEF上创建边缘节点后可得到。
mapping_rule	否	Object	batch服务类型可选。输入参数与csv数据的映射关系，仅当mapping_type为csv时需要填写。映射规则与模型配置文件config.json中输入参数的定义方式相似，只需要在每一个基本类型（string/number/integer/boolean）的参数下配置index参数，指定使用csv数据中对应索引下标的数据作为此参数的值去发送推理请求，csv数据必须以英文半角逗号分隔，index从0开始计数，特殊地，当index为-1时忽略此参数。具体可参考创建批量服务的样例。
src_type	否	String	batch服务类型必选。数据来源类型，可选填ManifestFile；默认为空，表示只读取src_path目录下的文件；当取值为ManifestFile时，src_path必须为具体的manifest路径，在manifest文件中可指定多个数据路径（参考推理manifest规范）。
dest_path	否	String	batch服务类型必选。批量任务输出结果的OBS路径。
instance_count	是	Integer	公共参数。模型部署的实例数，当前限制最大实例数为128，如需使用更多的实例数，需提交工单申请。
additional_properties	否	Map<String,ModelAdditionalProperties>	模型部署附加属性，便于服务实例管理。
affinity	否	ServiceAffinity object	服务亲和部署

表6 CustomSpec
参数	是否必选	参数类型	描述
gpu_p4	否	Float	GPU个数，可选，默认不使用，支持配置小数，输入值不能小于0（最多支持2位小数，小数点后第3位做四舍五入处理）。
memory	是	Integer	内存，单位为MB，仅支持整数。
cpu	是	Float	CPU核数，支持配置小数，输入值不能小于0.01（最多支持2位小数，小数点后第3位做四舍五入处理）。
ascend_a310	否	Integer	Ascend芯片个数，可选，默认不使用，不支持与gpu同时配置。

表7 ModelAdditionalProperties
参数	是否必选	参数类型	描述
log_volume	否	Array of LogVolume objects	主机日志目录挂载。仅支持使用专属资源池部署服务场景。如果用户使用公共资源池部署服务，则不支持配置该参数，否则会报错。
max_surge	否	Float	必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。
max_unavailable	否	Float	必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。
termination_grace_period_seconds	否	Integer	容器优雅停止时间。
persistent_volumes	否	Array of PersistentVolumes objects	持久化存储挂载配置。
dew_secret	否	DewSecret object	DEW凭据

表8 LogVolume
参数	是否必选	参数类型	描述
host_path	是	String	主机上要映射的日志路径。
mount_path	是	String	容器中的日志路径。

表9 PersistentVolumes
参数	是否必选	参数类型	描述
name	否	String	存储卷的名称。
mount_path	是	String	存储卷在容器中的挂载路径。如：/tmp。请不要挂载在系统目录下，如“/”、“/var/run”等，会导致容器异常。建议挂载在空目录下，若目录不为空，请确保目录下无影响容器启动的文件，否则文件会被替换，导致容器启动异常，工作负载创建失败。
storage_type	否	String	挂载类型sfs_turbo极速文件系统挂载。
source_address	否	String	挂载源路径，挂载为极速文件时为sfs turbo id。

**表10** DewSecret
参数	是否必选	参数类型	描述
secret_name	否	String	DEW凭据名称

**表11** ServiceAffinity
参数	是否必选	参数类型	描述
node_affinity	否	NodeAffinity object	节点亲和的时候填入该字段

**表12** NodeAffinity
参数	是否必选	参数类型	描述
mode	是	String	节点亲和的方式，required表示强亲和，服务实例只能调度到指定节点，指定节点不存在则失败。preferred表示弱亲和，服务实例倾向于调度到指定节点，指定节点不满足调度条件，则会调度到其他节点。
pool_infos	否	Array of AffinityPoolInfo objects	配置亲和策略到指定的集群，并指定集群的节点。

**表13** AffinityPoolInfo
参数	是否必选	参数类型	描述
pool_name	是	String	集群名称，集群名称必须在外层pool_name中
nodes	是	Array of AffinityNodeInfo objects	亲和的节点列表信息

**表14** AffinityNodeInfo
参数	是否必选	参数类型	描述
name	是	String	节点名称，实际上对应的是节点的私有ip

**表15** ServiceAdditionalProperties
参数	是否必选	参数类型	描述
smn_notification	是	Map<String,SmnNotification>	smn消息通知结构，用于通知用户服务状态变化。
log_report_channels	否	Array of LogReportPipeline objects	日志通道组。没有配置或者数组长度为0时部署代表未启用LTS日志对接。开启后不支持修改。
websocket_upgrade	否	Boolean	服务接口是否升级为WebSocket。部署服务时，默认值为false；更新服务配置时，默认值为上一次设置的值。 false：不升级为WebSocket。 true：升级为WebSocket。开启后，不支持修改。开启WebSocket时，不支持同时设置“服务流量限制”。

**表16** SmnNotification
参数	是否必选	参数类型	描述
topic_urn	是	String	smn主题urn地址。
events	是	Array of integers	事件ID，目前已有事件ID如下： 1：failed 3：running 7：concerning 11：pending

**表17** LogReportPipeline
参数	是否必选	参数类型	描述
type	是	String	日志通道类型（目前支持LTS）。
configuration	否	LtsConfiguration object	LTS日志配置。

**表18** LtsConfiguration
参数	是否必选	参数类型	描述
log_group_id	是	String	LTS日志组id，长度64。
log_stream_id	是	String	LTS日志流id，长度64。

**表19** ServiceSecret
参数	是否必选	参数类型	描述
secretId	是	String	密钥id
mount_path	是	String	挂载路径

响应参数

状态码：200

**表20** 响应Body参数
参数	参数类型	描述
service_id	String	服务id。
resource_ids	Array of strings	资源id数组，服务对应的模型生成的资源ID。

请求示例

请求示例，创建在线服务。

POST https://{endpoint}/v1/{project_id}/services

{
  "infer_type" : "real-time",
  "service_name" : "mnist",
  "description" : "mnist service",
  "config" : [ {
    "specification" : "modelarts.vm.cpu.2u",
    "weight" : 100,
    "model_id" : "0e07b41b-173e-42db-8c16-8e1b44cc0d44",
    "instance_count" : 1
  } ]
}

请求示例，创建在线服务且配置多版本分流。

POST https://{endpoint}/v1/{project_id}/services

{
  "service_name" : "mnist",
  "description" : "mnist service",
  "infer_type" : "real-time",
  "config" : [ {
    "model_id" : "xxxmodel-idxxx",
    "weight" : "70",
    "specification" : "modelarts.vm.cpu.2u",
    "instance_count" : 1,
    "envs" : {
      "model_name" : "mxnet-model-1",
      "load_epoch" : "0"
    }
  }, {
    "model_id" : "xxxxxx",
    "weight" : "30",
    "specification" : "modelarts.vm.cpu.2u",
    "instance_count" : 1
  } ]
}

请求示例，创建专属资源池自定义规格在线服务样例。

POST https://{endpoint}/v1/{project_id}/services

{
  "service_name" : "realtime-demo",
  "description" : "",
  "infer_type" : "real-time",
  "cluster_id" : "8abf68a969c3cb3a0169c4acb24b0000",
  "config" : [ {
    "model_id" : "eb6a4a8c-5713-4a27-b8ed-c7e694499af5",
    "weight" : "100",
    "cluster_id" : "8abf68a969c3cb3a0169c4acb24b0000",
    "specification" : "custom",
    "custom_spec" : {
      "cpu" : 1.5,
      "memory" : 7500
    },
    "instance_count" : 1
  } ]
}

请求示例，创建在线服务设置自动停止。

POST https://{endpoint}/v1/{project_id}/services

{
  "service_name" : "service-demo",
  "description" : "demo",
  "infer_type" : "real-time",
  "config" : [ {
    "model_id" : "xxxmodel-idxxx",
    "weight" : "100",
    "specification" : "modelarts.vm.cpu.2u",
    "instance_count" : 1
  } ],
  "schedule" : [ {
    "type" : "stop",
    "time_unit" : "HOURS",
    "duration" : 1
  } ]
}

请求示例，创建批量服务且输入数据映射方式为“file”。

POST https://{endpoint}/v1/{project_id}/services

{
  "service_name" : "batchservicetest",
  "description" : "",
  "infer_type" : "batch",
  "cluster_id" : "8abf68a969c3cb3a0169c4acb24b****",
  "config" : [ {
    "model_id" : "598b913a-af3e-41ba-a1b5-bf065320f1e2",
    "specification" : "modelarts.vm.cpu.2u",
    "instance_count" : 1,
    "src_path" : "https://infers-data.obs.xxxxx.com/xgboosterdata/",
    "dest_path" : "https://infers-data.obs.xxxxx.com/output/",
    "req_uri" : "/",
    "mapping_type" : "file"
  } ]
}

请求示例，创建批量服务且输入数据映射方式为“csv”。

POST https://{endpoint}/v1/{project_id}/services

{
  "service_name" : "batchservicetest",
  "description" : "",
  "infer_type" : "batch",
  "config" : [ {
    "model_id" : "598b913a-af3e-41ba-a1b5-bf065320f1e2",
    "specification" : "modelarts.vm.cpu.2u",
    "instance_count" : 1,
    "src_path" : "https://infers-data.obs.xxxxx.com/xgboosterdata/",
    "dest_path" : "https://infers-data.obs.xxxxx.com/output/",
    "req_uri" : "/",
    "mapping_type" : "csv",
    "mapping_rule" : {
      "type" : "object",
      "properties" : {
        "data" : {
          "type" : "object",
          "properties" : {
            "req_data" : {
              "type" : "array",
              "items" : [ {
                "type" : "object",
                "properties" : {
                  "input5" : {
                    "type" : "number",
                    "index" : 0
                  },
                  "input4" : {
                    "type" : "number",
                    "index" : 1
                  },
                  "input3" : {
                    "type" : "number",
                    "index" : 2
                  },
                  "input2" : {
                    "type" : "number",
                    "index" : 3
                  },
                  "input1" : {
                    "type" : "number",
                    "index" : 4
                  }
                }
              } ]
            }
          }
        }
      }
    }
  } ]
}

请求示例，创建边缘服务样例。

POST https://{endpoint}/v1/{project_id}/services

{
  "service_name" : "service-edge-demo",
  "description" : "",
  "infer_type" : "edge",
  "config" : [ {
    "model_id" : "eb6a4a8c-5713-4a27-b8ed-c7e694499af5",
    "specification" : "custom",
    "instance_count" : 1,
    "custom_spec" : {
      "cpu" : 1.5,
      "memory" : 7500
    },
    "envs" : { },
    "nodes" : [ "2r8c4fb9-t497-40u3-89yf-skui77db0472" ]
  } ]
}

响应示例

状态码：200

服务部署成功。

{
  "service_id" : "10eb0091-887f-4839-9929-cbc884f1e20e",
  "resource_ids" : [ "INF-f878991839647358@1598319442708" ]
}

状态码

状态码	描述
200	服务部署成功。

错误码

请参见错误码。

父主题： 服务管理

上一篇：查询服务列表 - ListServices

下一篇：查询支持的服务部署规格 - ShowServiceSpecifications

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消