搜索知识库
功能介绍
根据query,在指定知识库中搜索得到topN相关的文档分片内容。
URI
POST /v1/{project_id}/applications/{application_id}/uni-search/experience/searchtext
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
是 |
String |
参数解释: 接口鉴权使用的Token,Token获取方式参考:获取IAM用户Token。 约束限制: 不涉及 取值范围: 不涉及 默认取值: 不涉及 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
repo_id |
是 |
String |
参数解释: 知识库ID。 约束限制: 只能包含1到64位数字、字母、中划线和下划线。 取值范围: 不涉及 默认取值: 不涉及 |
extra_repo_ids |
否 |
Array of strings |
参数解释: 多知识库搜索。 约束限制: 不涉及 取值范围: 列表长度小于9,并且id唯一不存在重复值。 默认取值: 不涉及 |
content |
是 |
String |
参数解释: 搜索内容。 约束限制: 不涉及 取值范围: 长度不能超过1000个字符。 默认取值: 不涉及 |
scope |
否 |
String |
参数解释: 搜索范围,定义搜索索引中的信息子集,默认文档库。 约束限制: 不涉及 取值范围:
默认取值: doc |
filter_string |
否 |
String |
参数解释: 带语法的查询字符串,使用具有严格语法的解析器,根据提供的查询字符串返回文档。 例如:tags:(魔都 OR 首都) AND category:"城市(city)" 例如:需要依据文件ID过滤分片,则使用:"fileId": "f6a050ffef5512e80a6dea57e386f194" 约束限制:
取值范围: 不涉及 默认取值: 不涉及 |
page_num |
是 |
Integer |
参数解释: 页码。 约束限制: 不涉及 取值范围: 范围1~9999,注意page_num+page_size不能超过10000。 默认取值: 不涉及 |
page_size |
是 |
Integer |
参数解释: 页面大小。 约束限制: 不涉及 取值范围: 范围1~9999,注意page_num+page_size不能超过10000。 默认取值: 不涉及 |
search_threshold |
否 |
Float |
参数解释: 搜索阈值(只针对向量搜索),范围0~200。 约束限制: 不涉及 取值范围: 0-200 默认取值: 不涉及 |
响应参数
状态码:200
参数 |
参数类型 |
描述 |
---|---|---|
doc_list |
Array of ChatReferenceInfo objects |
参数解释: 文档列表。 取值范围: 不涉及 |
total |
Integer |
参数解释: 总数。 取值范围: 不涉及 |
参数 |
参数类型 |
描述 |
---|---|---|
file_id |
String |
参数解释: 文件id(或FAQ id)。 取值范围: 不涉及 |
chunk_id |
String |
参数解释: 块ID。 取值范围: 不涉及 |
title |
String |
参数解释: 标题。 取值范围: 不涉及 |
subtitle |
String |
参数解释: 文档子标题。 取值范围: 不涉及 |
content |
String |
参数解释: 文本内容。 取值范围: 不涉及 |
big_content |
String |
参数解释: 内容上下文,比如未分片的原始表格。 注意: (1)搜索接口可能有值 (2)问答接口会将big_content替换到content,此字段清空。 取值范围: 不涉及 |
doc_type |
String |
参数解释: 文档类型(doc-文档,faq-问答)。 取值范围: 不涉及 |
file_path |
String |
参数解释: 文档归档路径。 取值范围: 不涉及 |
category |
String |
参数解释: 文档目录,单值,对应目录树中的叶子节点。 取值范围: 不涉及 |
tags |
Array of strings |
参数解释: 文档标签列表。 取值范围: 不涉及 |
update_date_time |
String |
参数解释: 更新时间。 取值范围: 不涉及 |
repo_id |
String |
参数解释: 知识库标识。 取值范围: 不涉及 |
page_num |
Long |
参数解释: 页码。 取值范围: 不涉及 |
component_num |
Long |
参数解释: 切片顺序数。 取值范围: 不涉及 |
score |
Float |
参数解释: ES打分。 取值范围: 不涉及 |
additional_fields |
Map<String,Object> |
参数解释: 用于存储未知字段的。 取值范围: 不涉及 |
请求示例
根据query,在指定知识库中搜索得到topN相关的文档分片内容。
/v1/123456/applications/123456/uni-search/experience/searchtext { "repo_id" : "1234abdc", "content" : "写一个穿越到宋朝的故事。", "page_num" : 1, "page_size" : 10 }
响应示例
状态码:200
搜索结果返回体。
{ "doc_list" : [ { "file_id" : "123abc", "title" : "人工智能.doc", "content" : "人工智能", "update_date_time" : "134554", "doc_type" : "doc", "file_path" : "uni-search/v1/人工智能.doc", "score" : 0.9999 } ], "total" : 12 }
状态码
状态码 |
描述 |
---|---|
200 |
搜索结果返回体。 |
错误码
请参见错误码。