查询模型部署详情
功能介绍
本接口用于精确获取某个指定的模型部署的全景元数据。与列表查询相比,它无需复杂过滤,直接通过唯一的 deployment_id 命中目标,返回包括绑定的智能体信息、上下游服务ID、最新运行状态以及最终生成的推理API调用地等核心字段。
适用场景:
查询特定部署实例的完整配置信息与实时状态等信息。
URI
GET /v1/ops/model-deployments/{deployment_id}
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| deployment_id | 是 | String | 参数解释:模型部署任务ID,获取方法请参见查询模型部署列表。 约束限制:不涉及 取值范围:真实存在的部署ID字符串。 默认取值:无 |
请求参数
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| Content-Type | 是 | String | 参数解释: 消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。 约束限制: 不涉及 取值范围: application/json 默认取值: application/json |
| Authorization | 是 | String | 参数解释: 签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
| X-Sdk-Date | 是 | String | 参数解释: 请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
响应参数
状态码:200
| 参数 | 参数类型 | 描述 |
|---|---|---|
| id | String | 参数解释: 部署任务ID,标识部署任务的唯一标识符。 取值范围: UUID格式字符串。 |
| task_id | String | 参数解释: 关联的智能体优化任务ID。 取值范围: 任务ID字符串。 |
| product_id | String | 参数解释: 智能体优化任务产物ID。 取值范围: 产物ID字符串。 |
| task_name | String | 参数解释: 智能体优化任务名称。 取值范围: 任务名称字符串。 |
| agent | OpsTuningTargetAgent object | 参数解释: 调优目标对象,包含目标智能体的配置信息。 取值范围: 符合OpsTuningTargetAgent定义的对象。 |
| model_name | String | 参数解释: 被调优的模型名称。 取值范围: 模型名称字符串。 |
| ma_service_id | String | 参数解释: ModelArts服务ID,关联底层ModelArts平台的服务实例。 取值范围: ModelArts侧的服务ID字符串。 |
| model_provider_id | String | 参数解释: 模型提供商ID,标识模型来源的服务商。 取值范围: 提供商标识字符串。 |
| model_service_id | String | 参数解释: 模型服务ID,本平台生成的服务唯一标识。 取值范围: 模型服务唯一标识字符串。 |
| model_service_name | String | 参数解释: 模型服务名称。 取值范围: 模型服务显示名称 |
| api_url | String | 参数解释: 部署服务API地址。 取值范围: 合法的URL字符串。 |
| status | String | 参数解释: 部署状态。 取值范围: deploying部署中,running运行中,stopping停止中,stopped已停止,starting启动中,fail失败,deleting删除中。 |
| created_at | Long | 参数解释: 创建时间,单位:毫秒(13位时间戳)。 取值范围: 13位毫秒级时间戳。 |
| 参数 | 参数类型 | 描述 |
|---|---|---|
| type | String | 参数解释: 智能体类型。 取值范围: 单智能体agent,工作流workflow。 |
| id | String | 参数解释: 智能体ID。 取值范围: 必须是系统中存在的真实ID。 |
| version | String | 参数解释: 智能体版本。 取值范围: 版本号字符串,默认为latest。 |
| node_type | String | 参数解释: 工作流节点类型。仅当type为workflow时生效。 取值范围: 意图识别节点intent_detection,大模型节点llm。 |
| node_id | String | 参数解释: 工作流节点ID。仅当type为workflow时生效。 取值范围: 有效节点标识符字符串。 |
状态码:400
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
状态码:404
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
状态码:500
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
请求示例
用于精确获取某个指定部署任务的全景元数据。
GET https://*.com/v1/ops/model-deployments/deploy-9876543210fedcba Content-Type:application/json X-Sdk-Date:20240416T095341Z Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************
响应示例
状态码:200
{
"id" : "deploy-9876543210fedcba",
"task_id" : "57ae91cf2f504899921a50d1c75f0547",
"product_id" : "prod-1234567890abcdef",
"task_name" : "数学推理优化任务",
"agent" : {
"type" : "agent",
"id" : "f0fab58d-8285-4c47-b856-1079cad579da",
"version" : null,
"node_type" : "intent_detection",
"node_id" : "node_1773821451705"
},
"model_name" : "qwen3_8b",
"ma_service_id" : "ma-svc-123456",
"model_provider_id" : "provider-qwen",
"model_service_id" : "model-svc-789",
"model_service_name" : "my-math-reasoning-service",
"api_url" : "https://modelarts-api.example.com/v1/services/my-math-reasoning-service",
"status" : "running",
"created_at" : 1704240000000
} 状态码
| 状态码 | 描述 |
|---|---|
| 200 | 参数解释:模型部署详情。 取值范围:无 |
| 400 | 参数解释:无效的请求参数。 取值范围:无 |
| 404 | 参数解释:模型部署未找到。 取值范围:无 |
| 500 | 参数解释:内部服务器错误。 取值范围:无 |
错误码
请参见错误码。