查询模型部署列表
功能介绍
本接口用于分页查询当前租户下的智能体优化任务模型部署列表,支持按任务ID、状态、名称等多维度过滤,并返回全局状态统计。
适用场景:
- 分页浏览所有已部署的模型服务,快速查看服务的运行状态与关联的优化任务。
- 根据部署状态(如运行中、失败)筛选服务,批量监控在线服务的健康情况,或排查部署失败的任务。
URI
GET /v1/ops/model-deployments
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| task_id | 否 | String | 参数解释: 智能体优化任务ID,标识任务的唯一标识符。获取方法请参考查询智能体优化任务列表。 约束限制: 不涉及 取值范围: 真实存在的模型优化任务ID字符串。 默认取值: 无 |
| offset | 否 | Integer | 参数解释: 索引位置偏移量,用于指定从第几条记录开始返回,单位:条(记录数)。 约束限制: 不涉及 取值范围: 大于等于0的整数。 默认取值: 0 |
| limit | 否 | Integer | 参数解释: 每页查询的记录数,单位:条。 约束限制: 不涉及 取值范围: 1到100的正整数。 默认取值: 无 |
| status | 否 | String | 参数解释: 部署状态,用于根据状态筛选任务。 约束限制: 不涉及 取值范围: deploying部署中,running运行中,stopping停止中,stopped已停止,starting启动中,fail失败,deleting删除中。 默认取值: 无 |
| model_service_name | 否 | String | 参数解释: 模型服务名称。 约束限制: 选填参数,支持模糊匹配。 取值范围: 模型服务名称字符串。 默认取值: 无 |
| model_name | 否 | String | 参数解释: 模型名称。 约束限制: 支持模糊匹配。 取值范围: 模型名称字符串。 默认取值: 无 |
请求参数
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| Content-Type | 是 | String | 参数解释: 消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。 约束限制: 不涉及 取值范围: application/json 默认取值: application/json |
| Authorization | 是 | String | 参数解释: 签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
| X-Sdk-Date | 是 | String | 参数解释: 请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
响应参数
状态码:200
| 参数 | 参数类型 | 描述 |
|---|---|---|
| total | Integer | 参数解释: 满足条件的部署记录总数,用于计算分页总页数。 取值范围: 大于等于0的整数。 |
| status_count | DeployTaskStatusCount object | 参数解释: 全局任务状态统计对象,包含各状态下的部署任务数量。 取值范围: 符合DeployTaskStatusCount定义的对象。 |
| deployments | Array of OpsModelDeploymentInfo objects | 参数解释: 部署任务列表。 取值范围: 符合OpsModelDeploymentInfo定义的对象数组。 |
| 参数 | 参数类型 | 描述 |
|---|---|---|
| deploying | Integer | 参数解释: 部署中任务个数,单位:个。 取值范围: 0-1000的整数。 |
| running | Integer | 参数解释: 运行中任务个数,单位:个。 取值范围: 0-1000的整数。 |
| stopping | Integer | 参数解释: 停止中任务个数,单位:个。 取值范围: 0-1000的整数。 |
| stopped | Integer | 参数解释: 已停止任务个数,单位:个。 取值范围: 0-1000的整数。 |
| starting | Integer | 参数解释: 启动中任务个数,单位:个。 取值范围: 0-1000的整数。 |
| fail | Integer | 参数解释: 失败任务个数,单位:个。 取值范围: 0-1000的整数。 |
| deleting | Integer | 参数解释: 删除中任务个数,单位:个。 取值范围: 0-1000的整数。 |
| 参数 | 参数类型 | 描述 |
|---|---|---|
| id | String | 参数解释: 部署任务ID,标识部署任务的唯一标识符。 取值范围: UUID格式字符串。 |
| task_id | String | 参数解释: 关联的智能体优化任务ID。 取值范围: 任务ID字符串。 |
| product_id | String | 参数解释: 智能体优化任务产物ID。 取值范围: 产物ID字符串。 |
| task_name | String | 参数解释: 智能体优化任务名称。 取值范围: 任务名称字符串。 |
| agent | OpsTuningTargetAgent object | 参数解释: 调优目标对象,包含目标智能体的配置信息。 取值范围: 符合OpsTuningTargetAgent定义的对象。 |
| model_name | String | 参数解释: 被调优的模型名称。 取值范围: 模型名称字符串。 |
| ma_service_id | String | 参数解释: ModelArts服务ID,关联底层ModelArts平台的服务实例。 取值范围: ModelArts侧的服务ID字符串。 |
| model_provider_id | String | 参数解释: 模型提供商ID,标识模型来源的服务商。 取值范围: 提供商标识字符串。 |
| model_service_id | String | 参数解释: 模型服务ID,本平台生成的服务唯一标识。 取值范围: 模型服务唯一标识字符串。 |
| model_service_name | String | 参数解释: 模型服务名称。 取值范围: 模型服务显示名称 |
| api_url | String | 参数解释: 部署服务API地址。 取值范围: 合法的URL字符串。 |
| status | String | 参数解释: 部署服务状态。 取值范围: deploying部署中,running运行中,stopping停止中,stopped已停止,starting启动中,fail失败,deleting删除中。 |
| created_at | Long | 参数解释: 创建时间,单位:毫秒(13位时间戳)。 取值范围: 13位毫秒级时间戳。 |
| 参数 | 参数类型 | 描述 |
|---|---|---|
| type | String | 参数解释: 智能体类型。 取值范围: 单智能体agent,工作流workflow。 |
| id | String | 参数解释: 智能体ID。 取值范围: 必须是系统中存在的真实ID。 |
| version | String | 参数解释: 智能体版本。 取值范围: 版本号字符串,默认为latest。 |
| node_type | String | 参数解释: 工作流节点类型。仅当type为workflow时生效。 取值范围: 意图识别节点intent_detection,大模型节点llm。 |
| node_id | String | 参数解释: 工作流节点ID。仅当type为workflow时生效。 取值范围: 有效节点标识符字符串。 |
状态码:400
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
状态码:500
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | 参数解释: 机器可读的错误代码。 取值范围: 系统错误码字符串。 |
| error_msg | String | 参数解释: 人类可读的错误消息。 取值范围: 详细错误说明字符串。 |
请求示例
用于分页查询当前租户下的模型部署任务列表,支持按任务ID、状态、名称等多维度过滤,并返回全局状态统计。
GET https://*.com/v1/ops/model-deployments?offset=0&limit=10&status=running&model_service_name=test&model_name=qwen3_8b&task_id=12345678901234567890123456789012 Content-Type:application/json X-Sdk-Date:20240416T095341Z Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************
响应示例
状态码:200
{
"total" : 2,
"status_count" : {
"deploying" : 0,
"running" : 2,
"stopping" : 0,
"stopped" : 1,
"starting" : 0,
"fail" : 0,
"deleting" : 0
},
"deployments" : [ {
"id" : "deploy-001",
"task_id" : "57ae91cf2f504899921a50d1c75f0547",
"product_id" : "prod-001",
"task_name" : "数学推理优化任务",
"agent" : {
"type" : "agent",
"id" : "f0fab58d-8285-4c47-b856-1079cad579da",
"version" : null,
"node_type" : "intent_detection",
"node_id" : "node_1773821451705"
},
"model_name" : "qwen3_8b",
"ma_service_id" : "ma-service-456",
"model_provider_id" : "provider-789",
"model_service_id" : "model-svc-001",
"model_service_name" : "qwen3-math-inference",
"api_url" : "https://model-api.example.com/v1/chat/completions",
"status" : "running",
"created_at" : 1704067200000
} ]
} 状态码
| 状态码 | 描述 |
|---|---|
| 200 | 参数解释:模型部署列表。 取值范围:无 |
| 400 | 参数解释:无效的请求参数。 取值范围:无 |
| 500 | 参数解释:内部服务器错误。 取值范围:无 |
错误码
请参见错误码。