获取推理服务信息
功能介绍
该API用于获取AI开发平台ModelArts-在线服务的推理服务信息。当创建自定义接入点的“source”参数选择“custom_from_modelarts_v2”时,获取推理服务信息。
接口约束
该功能仅支持“西南-贵阳一”区域。
URI
GET /v1/{project_id}/maas/services/custom-endpoint/services/{region_id}?workspace_id={workspace_id}
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
project-id |
是 |
String |
参数解释:项目ID,获取方式请参见获取项目ID和名称。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
|
region_id |
是 |
String |
参数解释:AI开发平台ModelArts-在线服务的Region信息。获取方式请参见获取区域信息。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
|
workspace_id |
否 |
String |
参数解释:通过传入workspace_id查询指定工作空间下的资源。不传则默认default空间。获取方式请参见获取工作空间信息。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
请求参数
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
X-Auth-Token |
是 |
String |
参数解释:用户Token。通过调用IAM服务的获取用户Token接口获取(响应消息头中X-Subject-Token的值)。获取方式请参见认证鉴权。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
|
Content-Type |
是 |
String |
参数解释:消息体的类型,固定为application/json。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 |
响应参数
|
参数 |
参数类型 |
描述 |
|---|---|---|
|
data |
Array[InferServerInfo] |
参数解释:推理服务信息。 取值范围:不涉及。 |
|
pages |
Integer |
参数解释:总页数。 取值范围:不涉及。 |
|
total |
Integer |
参数解释:推理信息总数。 取值范围:不涉及。 |
|
参数 |
参数类型 |
描述 |
|---|---|---|
|
id |
String |
参数解释:推理服务ID。 取值范围:不涉及。 |
|
name |
String |
参数解释:推理服务名称。 取值范围:不涉及。 |
|
status |
String |
参数解释:推理服务状态。 取值范围:不涉及。 |
|
version |
String |
参数解释:版本。 取值范围:不涉及。 |
|
version_count |
String |
参数解释:版本总数。 取值范围:不涉及。 |
|
description |
String |
参数解释:推理服务描述。 取值范围:不涉及。 |
|
type |
String |
参数解释:推理服务类型。 取值范围:不涉及。 |
|
deploy_type |
String |
参数解释:部署类型。 取值范围:不涉及。 |
|
user_name |
String |
参数解释:用户名称。 取值范围:不涉及。 |
|
workspace_id |
String |
参数解释:工作空间。 取值范围:不涉及。 |
|
create_at |
String |
参数解释:创建时间。 取值范围:不涉及。 |
|
update_at |
String |
参数解释:更新时间。 取值范围:不涉及。 |
|
auth_type |
String |
参数解释:认证方式。 取值范围:不涉及。 |
|
参数 |
参数类型 |
描述 |
|---|---|---|
|
error_msg |
String |
参数解释:错误描述信息。 取值范围:不涉及。 |
|
error_code |
String |
参数解释:错误码,标识错误类型。 取值范围:不涉及。 |
请求示例
GET
/v1/{project_id}/maas/services/custom-endpoint/services/{region_id}?workspace_id={workspace_id}
响应示例
- 成功响应,状态码:200
{ "data": [ { "id": "add6b9f8-7e97-4f1c-8816-************", "name": "dpsk-v3_2-*****", "status": "RUNNING", "version": "0.0.9", "version_count": 10, "description": "DeepSeek-V3.2-EXP", "type": "REAL_TIME", "deploy_type": "MULTI", "user_name": "*****", "workspace_id": "0", "create_at": 1760538261106, "update_at": 1765711080510, "auth_type": "NONE" } ], "pages": 1, "total": 1, } - 错误响应,状态码:400
{ "error_msg": "Invalid token.", "error_code": "ModelArts.0104" }
状态码
请参见状态码。
错误码
请参见错误码。