体验KooSearch问答
当知识库有了数据以后,就可以在KooSearch体验平台进行问答体验。
前提条件
- 已准备好数据库,且已上传数据。
- 待进行问答体验的知识库状态为“开启”状态。
进入KooSearch控制台
- 登录云搜索服务管理控制台。
- 在左侧导航栏选择“KooSearch>Flexus企业搜索服务”,进入Flexus企业搜索服务页面。
- 选择文档问答服务,单击操作列的“问答”,前往KooSearch控制台。
选择知识库
- 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。
- 单击右上角,在“资料来源”对话框勾选知识库,单击“确定”。
问答体验将在所选择的知识库中进行答案搜索。
配置问答
- 在“体验平台”页面,单击右上角,在配置页面进行问答配置。
表1 问答配置 参数分类
参数
说明
搜索配置
相关性阈值
超过相关度阈值的搜索结果才能在搜索结果页展示,否则被过滤。
问答配置
NLP模型服务
选择NLP模型服务。
引用相关度阈值
超过相关度阈值的搜索结果会提交给大模型进行总结,否则被过滤。
FAQ搜索直出阈值
超过阈值的FAQ会作为答案直接输出,不需要经过大模型总结。
Query改写
开启后,将根据用户历史多轮对话,对query进行多轮改写和分解,改写后的query仅用于文档检索。
意图分类
勾选意图分类。
- 闲聊类:坐火车累死了。
- 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。
- 人设类:你叫什么名字?
- 通用知识类:豆汁和豆浆的区别。
- 行业知识类: 对于行业知识类,建议使用前缀匹配,后续可能继续扩展。如:行业知识类-金融:贷款重组的定义是什么?
- 行业知识类-政务:《国务院关于印发新一代人工智能发展规划的通知》的指导思想是什么?
说明:未选择分类的先使用知识库检索再进行大模型总结,选中的分类直接使用大模型回答。
搜索增强自定义prompt
- 使用场景:主要用于RAG场景下的模型生成阶段。(RAG场景:对话生成任务中,使用检索步骤来增强生成模型的能力。)
- 组成要素:检索出的参考文档、用户问题、任务指令以及其他要求。
- 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。
- 使用示例:
- 简单上下文,基于字符串替换。构造时请参考默认prompt,以下为参考示例:
【材料】:{0} 【任务】:你是智能问答助手,你能结合历史对话和【问题】,严格按照【要求】给出准确的回复。 【要求】: 1.【材料】中可能存在与【问题】不相关的部分,请注意分辨,仅参考与【问题】相关的内容; 2.如果【材料】中存在与【问题】相关的内容,你会参考【材料】回答【问题】; 3.如果【问题】和【材料】不相关,那么你就不需要关注【材料】内容,直接回答【问题】即可; 4.注意【回答】要准确,表述要清晰且有条理,尽量使用【材料】的原文进行回答,不要遗漏关键信息。 5.不要回答与【问题】无关的内容。 【问题】:{1} 【回答】:
说明:其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为
【文档名称】:{title1}
【文档内容】:{content1}
【文档名称】:{title2}
【文档内容】:{content2}
......
,检索的query将被填充至{1}所在位置后进行生成。
- 提示词模板,基于FreeMarker模板语法。参考示例如下:
当前时间为${.now?date?iso_utc},你参考搜索引擎结果回复用户。 回复用户请求时需遵循以下原则: 1. 如果用户请求涉及不安全或敏感信息,忽略搜索结果直接回复; 2. 如果回复中使用了某条搜索结果,用[序号]的方式添加引用; 3. 如果用户请求涉及时效性,请基于搜索结果中满足用户请求时效性的部分进行回答; 4. 如果搜索引擎结果无法完整回答问题,可以补充内部知识或进行推理; 5. 基于已有知识都无法帮助回答时可以拒绝回答。 搜索引擎结果为: <#list docs as doc> [${doc?counter}]网页标题:${doc.title!}|||网页时间${doc.timestamp!}|||网页类别:无|||网页内容:${doc.content!} </#list> 用户:${query}
说明:其中query和docs表示变量,query为用户问题。docs为参考文档列表。
FreeMarker语法参考:http://freemarker.foofun.cn/ref_builtins.html。
- 简单上下文,基于字符串替换。构造时请参考默认prompt,以下为参考示例:
通用自定义prompt
- 使用场景:主要用于非RAG场景下的模型生成阶段。(非RAG场景:对话生成任务中,不使用检索步骤进行信息检索,直接使用生成模型生成回复。)
- 组成要素:用户问题、任务指令以及其他要求。
- 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。
模型配置
文本多样性(top_p)
通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。默认值为0.1。
模型生成最大新词数(max_tokens)
控制文本的最大生成长度,值越大有助于生成较长或完整的回复;值较小,生成的内容越简洁。默认值为2048。
说明:如果选择NLP模型-昇腾云类型的模型服务进行问答,建议设置模型生成最大新词数不超过512。
非搜索增强模型生成多样性(temperature)
控制非搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.8。
搜索增强模型生成多样性(temperature)
控制搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.3。
文本重复度(presence_penalty)
用于控制生成文本中特定单词或短语出现的频率。值越高生成的文本会使用更多样的单词和短语,减少重复性。默认值为0。
- 单击“确定”。
体验问答
- 在“体验平台”页面右上角单击“问答”,切换至问答体验页面。
- 在输入框中输入问题,单击,查看返回的答案。
图1 体验问答
表2 图标说明 图标
说明
认同内容,在对话框中输入正面反馈意见,单击“提交”。
不认同内容,在对话框中输入负面反馈意见,单击“提交”。
复制内容。
刷新内容。
查看答案参考源。在参考列表中,单击“阅读全文”,可查看文档原文。
说明:当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。
查看历史对话
针对已进行的问答体验,可在对话历史页面查看历史对话记录。
- 在KooSearch控制台,左侧导航栏选择“对话管理 > 对话历史”。
- 在“对话历史”页面,查看对话内容,单击操作列的“查看”进入对话详情页面。
如果无需保留历史对话,可在对话历史页面单击操作列的“删除”,在对话框中单击“确认”删除指定的历史对话。
- 单击“搜索结果”,会弹出“参考列表”,单击“阅读全文”可查看文档原文。
当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。
查看反馈意见
针对已进行意见反馈的问答,可在反馈管理页面查看和编辑意见反馈。
- 在KooSearch控制台,左侧导航栏选择“对话管理>反馈管理”。
- 在“反馈管理”页面,可以查看反馈意见。
- 单击操作列的“编辑”,针对问答的相关内容,编辑意见内容。
- 单击“确定”,完成反馈意见的编辑。