列举模型
功能介绍
列举模型。
URI
GET /v1/koosearch/models/search
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
model_name | 否 | String | 模型名称。 |
model_type | 否 | String | 模型类型。枚举值:embedding,rerank,nlp,search-plan,query2query |
model_status | 否 | String | 模型状态。 |
page_num | 否 | Integer | 请求页码。 |
page_size | 否 | Integer | 请求限定响应结果的分页大小,例如5条/页,10条/页。 |
请求参数
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
X-Auth-Token | 是 | String | 参数解释: 接口鉴权使用的Token,Token获取方式参考:3.2节 认证鉴权。 约束限制: 不涉及。 |
响应参数
状态码:200
参数 | 参数类型 | 描述 |
|---|---|---|
models | Array of ModelInfo objects | 模型列表。 |
total | Integer | 返回总条数。 |
page_num | Integer | 页码。 |
page_size | Integer | 每页返回数量。 |
参数 | 参数类型 | 描述 |
|---|---|---|
name | String | 模型名称。 |
detail | String | 模型详情。 |
type | String | 模型类型。 |
endpoint | String | 模型endpoint。 |
status | String | 模型状态。 |
create_time | String | 模型创建时间。 |
update_time | String | 模型更新时间。 |
extend_config | ModelExtendConfig object | 模型扩展配置。 |
alias | String | 昇腾模型请求时使用的名称。 |
参数 | 参数类型 | 描述 |
|---|---|---|
iam_info | IamInfo object | iam鉴权委托信息。 |
custom_header | map<string, object> | 扩展请求头。 |
deployment_id | String | 模型的deployment_id信息。 |
vector_config | VectorConfig object | 向量模型的相关配置。 |
nlp_config | NlpConfig object | NLP大模型相关配置。 |
参数 | 参数类型 | 描述 |
|---|---|---|
iam_enabled | Boolean | 是否启用iam鉴权。 |
agency_enabled | Boolean | 是否使用委托账号进行鉴权。 |
project_id | String | iam用户的project_id信息,iam_enable=true是为必填字段。 |
domain_name | String | 委托账号的账号名。 |
agency_name | String | 委托名。 |
参数 | 参数类型 | 描述 |
|---|---|---|
embedding_url | String | embedding或query2query模型的调用url。 |
rerank_url | String | rerank模型的调用url。 |
状态码:400
参数 | 参数类型 | 描述 |
|---|---|---|
error_code | String | |
error_msg | String | 错误描述 |
状态码:500
参数 | 参数类型 | 描述 |
|---|---|---|
error_code | String | |
error_msg | String | 错误描述 |
请求示例
无
响应示例
状态码:200
模型列表。
{
"page_num" : 1,
"page_size" : 1,
"total" : 1,
"models" : [ {
"name" : "pangu_38b",
"detail" : "pangu_38b",
"type" : "nlp",
"status" : "ready",
"create_time" : "1716946517167",
"update_time" : "1716946517167",
"endpoint" : "http://10.0.0.169:31010",
"extend_config" : {
"deployment_id" : "123",
"iam_info" : {
"iam_enabled" : false,
"agency_enabled" : false,
"project_id" : "456"
}
}
} ]
} 状态码
状态码 | 描述 |
|---|---|
200 | 模型列表。 |
400 | 请求体参数错误 |
500 | 内部异常 |
错误码
请参见错误码。

