新增模型
功能介绍
新增配置模型,包括模型名称、模型描述、模型endpoint、模型配置。
URI
POST /v1/koosearch/models
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
是 |
String |
参数解释: 接口鉴权使用的Token,Token获取方式参考:3.2节 认证鉴权。 约束限制: 不涉及。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
name |
是 |
String |
模型名称。 |
detail |
是 |
String |
模型描述。 |
endpoint |
是 |
String |
模型endpoint。 |
type |
是 |
String |
模型类型: pangu_chat 盘古对话模型 pangu_llm 盘古裸机模型 embedding 向量模型 query2query query2query模型 rerank 精排模型 search_plan 搜索规划模型 llm 原生模型 |
extend_config |
是 |
ModelExtendConfig object |
模型的自定义配置,json格式。 |
alias |
否 |
String |
昇腾模型场景请求模型需要的name。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
iam_info |
是 |
IamInfo object |
iam鉴权委托信息。 |
custom_header |
否 |
map<string, object> |
扩展请求头。 |
deployment_id |
否 |
String |
模型的deployment_id信息。 |
vector_config |
否 |
VectorConfig object |
向量模型的相关配置。 |
nlp_config |
否 |
NlpConfig object |
NLP大模型相关配置。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
iam_enabled |
否 |
Boolean |
是否启用iam鉴权。 |
agency_enabled |
否 |
Boolean |
是否使用委托账号进行鉴权。 |
project_id |
否 |
String |
iam用户的project_id信息,iam_enable=true是为必填字段。 |
domain_name |
否 |
String |
委托账号的账号名。 |
agency_name |
否 |
String |
委托名。 |
响应参数
状态码:400
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
错误描述 |
状态码:500
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
|
error_msg |
String |
错误描述 |
请求示例
POST https://{endpoint}/v1/koosearch/models { "name" : "pangu_v30_32k", "type" : "pangu_llm", "endpoint" : "http://10.0.0.169:31010", "detail" : "panguv30_4k", "extend_config" : { "deployment_id" : "panguv30_4k", "iam_info" : { "project_id" : "123", "iam_enabled" : false, "agency_enabled" : false }, "nlp_config" : { "context_length" : 32 } } }
响应示例
无
状态码
状态码 |
描述 |
---|---|
200 |
新增成功。 |
400 |
请求体错误 |
500 |
内部异常 |
错误码
请参见错误码。