更新时间:2026-04-30 GMT+08:00
分享

查询模型部署列表

功能介绍

本接口用于分页查询当前租户下的智能体优化任务模型部署列表,支持按任务ID、状态、名称等多维度过滤,并返回全局状态统计。

适用场景:

  • 分页浏览所有已部署的模型服务,快速查看服务的运行状态与关联的优化任务。
  • 根据部署状态(如运行中、失败)筛选服务,批量监控在线服务的健康情况,或排查部署失败的任务。

URI

GET /v1/ops/model-deployments

表1 Query参数

参数

是否必选

参数类型

描述

task_id

String

参数解释:

智能体优化任务ID,标识任务的唯一标识符。获取方法请参考查询智能体优化任务列表

约束限制:

不涉及

取值范围:

真实存在的模型优化任务ID字符串。

默认取值:

offset

Integer

参数解释:

索引位置偏移量,用于指定从第几条记录开始返回,单位:条(记录数)。

约束限制:

不涉及

取值范围:

大于等于0的整数。

默认取值:

0

limit

Integer

参数解释:

每页查询的记录数,单位:条。

约束限制:

不涉及

取值范围:

1到100的正整数。

默认取值:

status

String

参数解释:

部署状态,用于根据状态筛选任务。

约束限制:

不涉及

取值范围:

deploying部署中,running运行中,stopping停止中,stopped已停止,starting启动中,fail失败,deleting删除中。

默认取值:

model_service_name

String

参数解释:

模型服务名称。

约束限制:

选填参数,支持模糊匹配。

取值范围:

模型服务名称字符串。

默认取值:

model_name

String

参数解释:

模型名称。

约束限制:

支持模糊匹配。

取值范围:

模型名称字符串。

默认取值:

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

Content-Type

String

参数解释:

消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。

约束限制:

不涉及

取值范围:

application/json

默认取值:

application/json

Authorization

String

参数解释:

签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

X-Sdk-Date

String

参数解释:

请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

响应参数

状态码:200

表3 响应Body参数

参数

参数类型

描述

total

Integer

参数解释:

满足条件的部署记录总数,用于计算分页总页数。

取值范围:

大于等于0的整数。

status_count

DeployTaskStatusCount object

参数解释:

全局任务状态统计对象,包含各状态下的部署任务数量。

取值范围:

符合DeployTaskStatusCount定义的对象。

deployments

Array of OpsModelDeploymentInfo objects

参数解释:

部署任务列表。

取值范围:

符合OpsModelDeploymentInfo定义的对象数组。

表4 DeployTaskStatusCount

参数

参数类型

描述

deploying

Integer

参数解释:

部署中任务个数,单位:个。

取值范围:

0-1000的整数。

running

Integer

参数解释:

运行中任务个数,单位:个。

取值范围:

0-1000的整数。

stopping

Integer

参数解释:

停止中任务个数,单位:个。

取值范围:

0-1000的整数。

stopped

Integer

参数解释:

已停止任务个数,单位:个。

取值范围:

0-1000的整数。

starting

Integer

参数解释:

启动中任务个数,单位:个。

取值范围:

0-1000的整数。

fail

Integer

参数解释:

失败任务个数,单位:个。

取值范围:

0-1000的整数。

deleting

Integer

参数解释:

删除中任务个数,单位:个。

取值范围:

0-1000的整数。

表5 OpsModelDeploymentInfo

参数

参数类型

描述

id

String

参数解释:

部署任务ID,标识部署任务的唯一标识符。

取值范围:

UUID格式字符串。

task_id

String

参数解释:

关联的智能体优化任务ID。

取值范围:

任务ID字符串。

product_id

String

参数解释:

智能体优化任务产物ID。

取值范围:

产物ID字符串。

task_name

String

参数解释:

智能体优化任务名称。

取值范围:

任务名称字符串。

agent

OpsTuningTargetAgent object

参数解释:

调优目标对象,包含目标智能体的配置信息。

取值范围:

符合OpsTuningTargetAgent定义的对象。

model_name

String

参数解释:

被调优的模型名称。

取值范围:

模型名称字符串。

ma_service_id

String

参数解释:

ModelArts服务ID,关联底层ModelArts平台的服务实例。

取值范围:

ModelArts侧的服务ID字符串。

model_provider_id

String

参数解释:

模型提供商ID,标识模型来源的服务商。

取值范围:

提供商标识字符串。

model_service_id

String

参数解释:

模型服务ID,本平台生成的服务唯一标识。

取值范围:

模型服务唯一标识字符串。

model_service_name

String

参数解释:

模型服务名称。

取值范围:

模型服务显示名称

api_url

String

参数解释:

部署服务API地址。

取值范围:

合法的URL字符串。

status

String

参数解释:

部署服务状态。

取值范围:

deploying部署中,running运行中,stopping停止中,stopped已停止,starting启动中,fail失败,deleting删除中。

created_at

Long

参数解释:

创建时间,单位:毫秒(13位时间戳)。

取值范围:

13位毫秒级时间戳。

表6 OpsTuningTargetAgent

参数

参数类型

描述

type

String

参数解释:

智能体类型。

取值范围:

单智能体agent,工作流workflow。

id

String

参数解释:

智能体ID。

取值范围:

必须是系统中存在的真实ID。

version

String

参数解释:

智能体版本。

取值范围:

版本号字符串,默认为latest。

node_type

String

参数解释:

工作流节点类型。仅当type为workflow时生效。

取值范围:

意图识别节点intent_detection,大模型节点llm。

node_id

String

参数解释:

工作流节点ID。仅当type为workflow时生效。

取值范围:

有效节点标识符字符串。

状态码:400

表7 响应Body参数

参数

参数类型

描述

error_code

String

参数解释:

机器可读的错误代码。

取值范围:

系统错误码字符串。

error_msg

String

参数解释:

人类可读的错误消息。

取值范围:

详细错误说明字符串。

状态码:500

表8 响应Body参数

参数

参数类型

描述

error_code

String

参数解释:

机器可读的错误代码。

取值范围:

系统错误码字符串。

error_msg

String

参数解释:

人类可读的错误消息。

取值范围:

详细错误说明字符串。

请求示例

用于分页查询当前租户下的模型部署任务列表,支持按任务ID、状态、名称等多维度过滤,并返回全局状态统计。

GET https://*.com/v1/ops/model-deployments?offset=0&limit=10&status=running&model_service_name=test&model_name=qwen3_8b&task_id=12345678901234567890123456789012

Content-Type:application/json
X-Sdk-Date:20240416T095341Z
Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************

响应示例

状态码:200

{
  "total" : 2,
  "status_count" : {
    "deploying" : 0,
    "running" : 2,
    "stopping" : 0,
    "stopped" : 1,
    "starting" : 0,
    "fail" : 0,
    "deleting" : 0
  },
  "deployments" : [ {
    "id" : "deploy-001",
    "task_id" : "57ae91cf2f504899921a50d1c75f0547",
    "product_id" : "prod-001",
    "task_name" : "数学推理优化任务",
    "agent" : {
      "type" : "agent",
      "id" : "f0fab58d-8285-4c47-b856-1079cad579da",
      "version" : null,
      "node_type" : "intent_detection",
      "node_id" : "node_1773821451705"
    },
    "model_name" : "qwen3_8b",
    "ma_service_id" : "ma-service-456",
    "model_provider_id" : "provider-789",
    "model_service_id" : "model-svc-001",
    "model_service_name" : "qwen3-math-inference",
    "api_url" : "https://model-api.example.com/v1/chat/completions",
    "status" : "running",
    "created_at" : 1704067200000
  } ]
}

状态码

状态码

描述

200

参数解释:模型部署列表。

取值范围:

400

参数解释:无效的请求参数。

取值范围:

500

参数解释:内部服务器错误。

取值范围:

错误码

请参见错误码

相关文档