获取推理服务信息
功能介绍
该API用于获取AI开发平台ModelArts-在线服务的推理服务信息。当创建自定义接入点的“source”参数选择“custom_from_modelarts_v2”时,获取推理服务信息。
接口约束
该功能仅支持“西南-贵阳一”区域。
URI
GET /v1/{project_id}/maas/services/custom-endpoint/services/{region_id}?workspace_id={workspace_id} 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
project-id | 是 | String | 参数解释:项目ID,获取方式请参见获取项目ID和名称。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
region_id | 是 | String | 参数解释:AI开发平台ModelArts-在线服务的Region信息。获取方式请参见获取区域信息。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
workspace_id | 否 | String | 参数解释:通过传入workspace_id查询指定工作空间下的资源。不传则默认default空间。获取方式请参见获取工作空间信息。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
请求参数
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
X-Auth-Token | 是 | String | 参数解释:用户Token。通过调用IAM服务的获取用户Token接口获取(响应消息头中X-Subject-Token的值)。获取方式请参见认证鉴权。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
Content-Type | 是 | String | 参数解释:消息体的类型,固定为application/json。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
响应参数
参数 | 参数类型 | 描述 |
|---|---|---|
data | Array[InferServerInfo] | 参数解释:推理服务信息。 取值范围:不涉及。 |
pages | Integer | 参数解释:总页数。 取值范围:不涉及。 |
total | Integer | 参数解释:推理信息总数。 取值范围:不涉及。 |
参数 | 参数类型 | 描述 |
|---|---|---|
id | String | 参数解释:推理服务ID。 取值范围:不涉及。 |
name | String | 参数解释:推理服务名称。 取值范围:不涉及。 |
status | String | 参数解释:推理服务状态。 取值范围:不涉及。 |
version | String | 参数解释:版本。 取值范围:不涉及。 |
version_count | String | 参数解释:版本总数。 取值范围:不涉及。 |
description | String | 参数解释:推理服务描述。 取值范围:不涉及。 |
type | String | 参数解释:推理服务类型。 取值范围:不涉及。 |
deploy_type | String | 参数解释:部署类型。 取值范围:不涉及。 |
user_name | String | 参数解释:用户名称。 取值范围:不涉及。 |
workspace_id | String | 参数解释:工作空间。 取值范围:不涉及。 |
create_at | String | 参数解释:创建时间。 取值范围:不涉及。 |
update_at | String | 参数解释:更新时间。 取值范围:不涉及。 |
auth_type | String | 参数解释:认证方式。 取值范围:不涉及。 |
参数 | 参数类型 | 描述 |
|---|---|---|
error_msg | String | 参数解释:错误描述信息。 取值范围:不涉及。 |
error_code | String | 参数解释:错误码,标识错误类型。 取值范围:不涉及。 |
请求示例
GET
/v1/{project_id}/maas/services/custom-endpoint/services/{region_id}?workspace_id={workspace_id} 响应示例
- 成功响应,状态码:200
{ "data": [ { "id": "add6b9f8-7e97-4f1c-8816-************", "name": "dpsk-v3_2-*****", "status": "RUNNING", "version": "0.0.9", "version_count": 10, "description": "DeepSeek-V3.2-EXP", "type": "REAL_TIME", "deploy_type": "MULTI", "user_name": "*****", "workspace_id": "0", "create_at": 1760538261106, "update_at": 1765711080510, "auth_type": "NONE" } ], "pages": 1, "total": 1, } - 错误响应,状态码:400
{ "error_msg": "Invalid token.", "error_code": "ModelArts.0104" }
状态码
请参见状态码。
错误码
请参见错误码。

