更新时间:2024-12-20 GMT+08:00
分享

部署服务

功能介绍

部署一个Service实例。

URI

POST https://localhost.com/v1/workspaces/{workspace_id}/services/instances

表1 路径参数

参数

是否必选

参数类型

描述

workspace_id

String

  • 参数解释:Workspace的ID。

  • 约束限制:不涉及。

  • 取值范围:不涉及。

  • 默认取值:不涉及。

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

  • 参数解释:租户token。

  • 约束限制:不涉及。

  • 取值范围:不涉及。

  • 默认取值:不涉及。

表3 请求Body参数

参数

是否必选

参数类型

描述

source

SourceRef object

来源信息,Service信息或者模型信息

name

String

一个Service Instance的名称,只能包含中文、字母、数字、下划线、中划线、点、空格

description

Description object

描述信息

endpoint_id

EndpointId object

endpoint空间ID

config

ServiceInstanceConfig object

启动Service实例时输入的配置,在DeployService中使用

表4 SourceRef

参数

是否必选

参数类型

描述

id

String

一种资源ID,32~36位的英文、数字、中划线(-)组合。

version_id

String

一种资源ID,32~36位的英文、数字、中划线(-)组合。

表5 Description

参数

是否必选

参数类型

描述

-

String

描述信息

表6 EndpointId

参数

是否必选

参数类型

描述

-

String

endpoint空间ID

表7 ServiceInstanceConfig

参数

是否必选

参数类型

描述

model_instance_config

ModelServiceInstanceConfig object

模型服务实例的配置,在DeployService中使用

表8 ModelServiceInstanceConfig

参数

是否必选

参数类型

描述

resource

ResourceDemand object

资源需求量配置

表9 ResourceDemand

参数

是否必选

参数类型

描述

min

Integer

最小数

max

Integer

最大数,最小值为1,最大值为1000。

spec_code

String

资源规格,从规格列表查询获取。

响应参数

状态码: 200

表10 响应Body参数

参数

参数类型

描述

id

InstanceId object

实例ID。获取方法,请参见获取推理实例ID

表11 InstanceId

参数

参数类型

描述

-

String

实例ID。获取方法,请参见获取推理实例ID

状态码: 400

表12 响应Body参数

参数

参数类型

描述

error_code

String

错误码

error_msg

String

错误描述

solution_msg

String

解决方案描述

状态码: 401

表13 响应Body参数

参数

参数类型

描述

error_code

String

错误码

error_msg

String

错误描述

solution_msg

String

解决方案描述

状态码: 404

表14 响应Body参数

参数

参数类型

描述

error_code

String

错误码

error_msg

String

错误描述

solution_msg

String

解决方案描述

状态码: 408

表15 响应Body参数

参数

参数类型

描述

error_code

String

错误码

error_msg

String

错误描述

solution_msg

String

解决方案描述

状态码: 500

表16 响应Body参数

参数

参数类型

描述

error_code

String

错误码

error_msg

String

错误描述

solution_msg

String

解决方案描述

请求示例

响应示例

状态码

状态码

描述

200

正常响应

400

Bad request error

401

Unauthorized error

403

Forbidden error

404

Not found error

408

Request timeout error

500

Internal error

错误码

请参见错误码

相关文档