更新时间:2026-04-30 GMT+08:00
分享

查询模型部署详情

功能介绍

本接口用于精确获取某个指定的模型部署的全景元数据。与列表查询相比,它无需复杂过滤,直接通过唯一的 deployment_id 命中目标,返回包括绑定的智能体信息、上下游服务ID、最新运行状态以及最终生成的推理API调用地等核心字段。

适用场景:

查询特定部署实例的完整配置信息与实时状态等信息。

URI

GET /v1/ops/model-deployments/{deployment_id}

表1 路径参数

参数

是否必选

参数类型

描述

deployment_id

String

参数解释:模型部署任务ID,获取方法请参见查询模型部署列表

约束限制:不涉及

取值范围:真实存在的部署ID字符串。

默认取值:

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

Content-Type

String

参数解释:

消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。

约束限制:

不涉及

取值范围:

application/json

默认取值:

application/json

Authorization

String

参数解释:

签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

X-Sdk-Date

String

参数解释:

请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

响应参数

状态码:200

表3 响应Body参数

参数

参数类型

描述

id

String

参数解释:

部署任务ID,标识部署任务的唯一标识符。

取值范围:

UUID格式字符串。

task_id

String

参数解释:

关联的智能体优化任务ID。

取值范围:

任务ID字符串。

product_id

String

参数解释:

智能体优化任务产物ID。

取值范围:

产物ID字符串。

task_name

String

参数解释:

智能体优化任务名称。

取值范围:

任务名称字符串。

agent

OpsTuningTargetAgent object

参数解释:

调优目标对象,包含目标智能体的配置信息。

取值范围:

符合OpsTuningTargetAgent定义的对象。

model_name

String

参数解释:

被调优的模型名称。

取值范围:

模型名称字符串。

ma_service_id

String

参数解释:

ModelArts服务ID,关联底层ModelArts平台的服务实例。

取值范围:

ModelArts侧的服务ID字符串。

model_provider_id

String

参数解释:

模型提供商ID,标识模型来源的服务商。

取值范围:

提供商标识字符串。

model_service_id

String

参数解释:

模型服务ID,本平台生成的服务唯一标识。

取值范围:

模型服务唯一标识字符串。

model_service_name

String

参数解释:

模型服务名称。

取值范围:

模型服务显示名称

api_url

String

参数解释:

部署服务API地址。

取值范围:

合法的URL字符串。

status

String

参数解释:

部署状态。

取值范围:

deploying部署中,running运行中,stopping停止中,stopped已停止,starting启动中,fail失败,deleting删除中。

created_at

Long

参数解释:

创建时间,单位:毫秒(13位时间戳)。

取值范围:

13位毫秒级时间戳。

表4 OpsTuningTargetAgent

参数

参数类型

描述

type

String

参数解释:

智能体类型。

取值范围:

单智能体agent,工作流workflow。

id

String

参数解释:

智能体ID。

取值范围:

必须是系统中存在的真实ID。

version

String

参数解释:

智能体版本。

取值范围:

版本号字符串,默认为latest。

node_type

String

参数解释:

工作流节点类型。仅当type为workflow时生效。

取值范围:

意图识别节点intent_detection,大模型节点llm。

node_id

String

参数解释:

工作流节点ID。仅当type为workflow时生效。

取值范围:

有效节点标识符字符串。

状态码:400

表5 响应Body参数

参数

参数类型

描述

error_code

String

参数解释:

机器可读的错误代码。

取值范围:

系统错误码字符串。

error_msg

String

参数解释:

人类可读的错误消息。

取值范围:

详细错误说明字符串。

状态码:404

表6 响应Body参数

参数

参数类型

描述

error_code

String

参数解释:

机器可读的错误代码。

取值范围:

系统错误码字符串。

error_msg

String

参数解释:

人类可读的错误消息。

取值范围:

详细错误说明字符串。

状态码:500

表7 响应Body参数

参数

参数类型

描述

error_code

String

参数解释:

机器可读的错误代码。

取值范围:

系统错误码字符串。

error_msg

String

参数解释:

人类可读的错误消息。

取值范围:

详细错误说明字符串。

请求示例

用于精确获取某个指定部署任务的全景元数据。

GET https://*.com/v1/ops/model-deployments/deploy-9876543210fedcba

Content-Type:application/json
X-Sdk-Date:20240416T095341Z
Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************

响应示例

状态码:200

{
  "id" : "deploy-9876543210fedcba",
  "task_id" : "57ae91cf2f504899921a50d1c75f0547",
  "product_id" : "prod-1234567890abcdef",
  "task_name" : "数学推理优化任务",
  "agent" : {
    "type" : "agent",
    "id" : "f0fab58d-8285-4c47-b856-1079cad579da",
    "version" : null,
    "node_type" : "intent_detection",
    "node_id" : "node_1773821451705"
  },
  "model_name" : "qwen3_8b",
  "ma_service_id" : "ma-svc-123456",
  "model_provider_id" : "provider-qwen",
  "model_service_id" : "model-svc-789",
  "model_service_name" : "my-math-reasoning-service",
  "api_url" : "https://modelarts-api.example.com/v1/services/my-math-reasoning-service",
  "status" : "running",
  "created_at" : 1704240000000
}

状态码

状态码

描述

200

参数解释:模型部署详情。

取值范围:

400

参数解释:无效的请求参数。

取值范围:

404

参数解释:模型部署未找到。

取值范围:

500

参数解释:内部服务器错误。

取值范围:

错误码

请参见错误码

相关文档