启动模型部署
功能介绍
本接口用于启动已停止(stopped)的模型部署任务。系统会直接读取历史保留的资源与规格配置,重新向底层申请算力拉起服务。
适用场景:
快速恢复已暂停的模型服务,针对周期性使用的智能体任务,按需重新拉起算力资源,实现灵活的启停调度。
URI
POST /v1/ops/model-deployments/{deployment_id}/start
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| deployment_id | 是 | String | 参数解释:模型部署任务ID,获取方法请参见查询模型部署列表。 约束限制:不涉及 取值范围:真实存在的部署ID字符串。 默认取值:无 |
请求参数
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| Content-Type | 是 | String | 参数解释: 消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。 约束限制: 不涉及 取值范围: application/json 默认取值: application/json |
| Authorization | 是 | String | 参数解释: 签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
| X-Sdk-Date | 是 | String | 参数解释: 请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
响应参数
状态码:204
状态解释:操作成功。
状态码:404
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
状态码:500
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
请求示例
用于启动已停止(stopped)的部署任务。
POST https://*.com/v1/ops/model-deployments/deploy-9876543210fedcba/start Content-Type:application/json X-Sdk-Date:20240416T095341Z Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************
响应示例
无
状态码
| 状态码 | 描述 |
|---|---|
| 204 | 参数解释:操作成功。 取值范围:无 |
| 404 | 参数解释:模型部署未找到。 取值范围:无 |
| 500 | 参数解释:内部服务器错误。 取值范围:无 |
错误码
请参见错误码。