新增模型
功能介绍
新增配置模型,包括模型名称、模型描述、模型endpoint、模型配置。
URI
POST /v1/koosearch/models
请求参数
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| X-Auth-Token | 是 | String | 参数解释: 接口鉴权使用的Token,Token获取方式参考:3.2节 认证鉴权。 约束限制: 不涉及。 |
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| name | 是 | String | 模型名称。 |
| detail | 是 | String | 模型描述。 |
| endpoint | 是 | String | 模型endpoint。 |
| type | 是 | String | 模型类型: pangu_chat 盘古对话模型 pangu_llm 盘古裸机模型 embedding 向量模型 query2query query2query模型 rerank 精排模型 search_plan 搜索规划模型 llm 原生模型 |
| extend_config | 是 | ModelExtendConfig object | 模型的自定义配置,json格式。 |
| alias | 否 | String | 昇腾模型场景请求模型需要的name。 |
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| iam_info | 是 | IamInfo object | iam鉴权委托信息。 |
| custom_header | 否 | map<string, object> | 扩展请求头。 |
| deployment_id | 否 | String | 模型的deployment_id信息。 |
| vector_config | 否 | VectorConfig object | 向量模型的相关配置。 |
| nlp_config | 否 | NlpConfig object | NLP大模型相关配置。 |
| 参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
| iam_enabled | 否 | Boolean | 是否启用iam鉴权。 |
| agency_enabled | 否 | Boolean | 是否使用委托账号进行鉴权。 |
| project_id | 否 | String | iam用户的project_id信息,iam_enable=true是为必填字段。 |
| domain_name | 否 | String | 委托账号的账号名。 |
| agency_name | 否 | String | 委托名。 |
响应参数
状态码:200
新增成功。
状态码:400
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | |
| error_msg | String | 错误描述 |
状态码:500
| 参数 | 参数类型 | 描述 |
|---|---|---|
| error_code | String | |
| error_msg | String | 错误描述 |
请求示例
POST https://{endpoint}/v1/koosearch/models
{
"name" : "pangu_v30_32k",
"type" : "pangu_llm",
"endpoint" : "http://10.0.0.169:31010",
"detail" : "panguv30_4k",
"extend_config" : {
"deployment_id" : "panguv30_4k",
"iam_info" : {
"project_id" : "123",
"iam_enabled" : false,
"agency_enabled" : false
},
"nlp_config" : {
"context_length" : 32
}
}
} 响应示例
无
状态码
| 状态码 | 描述 |
|---|---|
| 200 | 新增成功。 |
| 400 | 请求体错误 |
| 500 | 内部异常 |
错误码
请参见错误码。