获取推理服务信息
功能介绍
该API用于获取AI开发平台ModelArts-在线服务的推理服务信息。当创建自定义接入点的“source”参数选择“custom_from_modelarts_v2”时,获取推理服务信息。
接口约束
该功能仅支持“西南-贵阳一”区域。
URI
GET /v1/{project_id}/maas/services/custom-endpoint/services/{region_id}?workspace_id={workspace_id} | 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| project-id | 是 | String | 参数解释:项目ID,获取方式请参见获取项目ID和名称。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
| region_id | 是 | String | 参数解释:AI开发平台ModelArts-在线服务的Region信息。获取方式请参见获取区域信息。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
| workspace_id | 否 | String | 参数解释:通过传入workspace_id查询指定工作空间下的资源。不传则默认default空间。获取方式请参见获取工作空间信息。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
请求参数
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| X-Auth-Token | 是 | String | 参数解释:用户Token。通过调用IAM服务的获取用户Token接口获取(响应消息头中X-Subject-Token的值)。获取方式请参见认证鉴权。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
| Content-Type | 是 | String | 参数解释:消息体的类型,固定为application/json。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
响应参数
| 参数 | 参数类型 | 描述 |
|---|---|---|
| data | Array[InferServerInfo] | 参数解释:推理服务信息。 取值范围:不涉及。 |
| pages | Integer | 参数解释:总页数。 取值范围:不涉及。 |
| total | Integer | 参数解释:推理信息总数。 取值范围:不涉及。 |
| 参数 | 参数类型 | 描述 |
|---|---|---|
| id | String | 参数解释:推理服务ID。 取值范围:不涉及。 |
| name | String | 参数解释:推理服务名称。 取值范围:不涉及。 |
| status | String | 参数解释:推理服务状态。 取值范围:不涉及。 |
| version | String | 参数解释:版本。 取值范围:不涉及。 |
| version_count | String | 参数解释:版本总数。 取值范围:不涉及。 |
| description | String | 参数解释:推理服务描述。 取值范围:不涉及。 |
| type | String | 参数解释:推理服务类型。 取值范围:不涉及。 |
| deploy_type | String | 参数解释:部署类型。 取值范围:不涉及。 |
| user_name | String | 参数解释:用户名称。 取值范围:不涉及。 |
| workspace_id | String | 参数解释:工作空间。 取值范围:不涉及。 |
| create_at | String | 参数解释:创建时间。 取值范围:不涉及。 |
| update_at | String | 参数解释:更新时间。 取值范围:不涉及。 |
| auth_type | String | 参数解释:认证方式。 取值范围:不涉及。 |
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_msg | String | 参数解释:错误描述信息。 取值范围:不涉及。 |
| error_code | String | 参数解释:错误码,标识错误类型。 取值范围:不涉及。 |
请求示例
GET
/v1/{project_id}/maas/services/custom-endpoint/services/{region_id}?workspace_id={workspace_id} 响应示例
- 成功响应,状态码:200
{ "data": [ { "id": "add6b9f8-7e97-4f1c-8816-************", "name": "dpsk-v3_2-*****", "status": "RUNNING", "version": "0.0.9", "version_count": 10, "description": "DeepSeek-V3.2-EXP", "type": "REAL_TIME", "deploy_type": "MULTI", "user_name": "*****", "workspace_id": "0", "create_at": 1760538261106, "update_at": 1765711080510, "auth_type": "NONE" } ], "pages": 1, "total": 1, } - 错误响应,状态码:400
{ "error_msg": "Invalid token.", "error_code": "ModelArts.0104" }
状态码
请参见状态码。
错误码
请参见错误码。