更新时间:2024-09-05 GMT+08:00
分享

体验KooSearch问答

当知识库有了数据以后,就可以在KooSearch体验平台进行问答体验。

前提条件

  • 已准备好数据库,且已上传数据。
  • 待进行问答体验的知识库状态为“开启”状态。

进入KooSearch控制台

  1. 登录云搜索服务管理控制台
  2. 在左侧导航栏选择“KooSearch>Flexus企业搜索服务”,进入Flexus企业搜索服务页面。
  3. 选择文档问答服务,单击操作列的“问答”,前往KooSearch控制台。

选择知识库

  1. 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。
  2. 单击右上角,在“资料来源”对话框勾选知识库,单击“确定”

    问答体验将在所选择的知识库中进行答案搜索。

配置问答

  1. “体验平台”页面,单击右上角,在配置页面进行问答配置。
    表1 问答配置

    参数分类

    参数

    说明

    搜索配置

    相关性阈值

    超过相关度阈值的搜索结果才能在搜索结果页展示,否则被过滤。

    问答配置

    NLP模型服务

    选择NLP模型服务。

    引用相关度阈值

    超过相关度阈值的搜索结果会提交给大模型进行总结,否则被过滤。

    FAQ搜索直出阈值

    超过阈值的FAQ会作为答案直接输出,不需要经过大模型总结。

    Query改写

    开启后,将根据用户历史多轮对话,对query进行多轮改写和分解,改写后的query仅用于文档检索。

    意图分类

    勾选意图分类。

    • 闲聊类:坐火车累死了。
    • 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。
    • 人设类:你叫什么名字?
    • 通用知识类:豆汁和豆浆的区别。
    • 行业知识类: 对于行业知识类,建议使用前缀匹配,后续可能继续扩展。如:行业知识类-金融:贷款重组的定义是什么?
    • 行业知识类-政务:《国务院关于印发新一代人工智能发展规划的通知》的指导思想是什么?
    说明:

    未选择分类的先使用知识库检索再进行大模型总结,选中的分类直接使用大模型回答。

    搜索增强自定义prompt

    • 使用场景:主要用于RAG场景下的模型生成阶段。(RAG场景:对话生成任务中,使用检索步骤来增强生成模型的能力。)
    • 组成要素:检索出的参考文档、用户问题、任务指令以及其他要求。
    • 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。
    • 使用示例:
      • 简单上下文,基于字符串替换。构造时请参考默认prompt,以下为参考示例:
        【材料】:{0}
        【任务】:你是智能问答助手,你能结合历史对话和【问题】,严格按照【要求】给出准确的回复。
        【要求】:
         1.【材料】中可能存在与【问题】不相关的部分,请注意分辨,仅参考与【问题】相关的内容;
         2.如果【材料】中存在与【问题】相关的内容,你会参考【材料】回答【问题】;
         3.如果【问题】和【材料】不相关,那么你就不需要关注【材料】内容,直接回答【问题】即可;
         4.注意【回答】要准确,表述要清晰且有条理,尽量使用【材料】的原文进行回答,不要遗漏关键信息。
         5.不要回答与【问题】无关的内容。
        【问题】:{1}
        【回答】:
        
        说明:

        其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为

        【文档名称】:{title1}

        【文档内容】:{content1}

        【文档名称】:{title2}

        【文档内容】:{content2}

        ......

        ,检索的query将被填充至{1}所在位置后进行生成。

      • 提示词模板,基于FreeMarker模板语法。参考示例如下:
        当前时间为${.now?date?iso_utc},你参考搜索引擎结果回复用户。
        回复用户请求时需遵循以下原则:
        1. 如果用户请求涉及不安全或敏感信息,忽略搜索结果直接回复;
        2. 如果回复中使用了某条搜索结果,用[序号]的方式添加引用;
        3. 如果用户请求涉及时效性,请基于搜索结果中满足用户请求时效性的部分进行回答;
        4. 如果搜索引擎结果无法完整回答问题,可以补充内部知识或进行推理;
        5. 基于已有知识都无法帮助回答时可以拒绝回答。
        搜索引擎结果为:
        <#list docs as doc>
            [${doc?counter}]网页标题:${doc.title!}|||网页时间${doc.timestamp!}|||网页类别:无|||网页内容:${doc.content!}
        </#list>
        用户:${query}
        
        说明:

        其中query和docs表示变量,query为用户问题。docs为参考文档列表。

        FreeMarker语法参考:http://freemarker.foofun.cn/ref_builtins.html

    通用自定义prompt

    • 使用场景:主要用于非RAG场景下的模型生成阶段。(非RAG场景:对话生成任务中,不使用检索步骤进行信息检索,直接使用生成模型生成回复。)
    • 组成要素:用户问题、任务指令以及其他要求。
    • 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。

    模型配置

    文本多样性(top_p)

    通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。默认值为0.1。

    模型生成最大新词数(max_tokens)

    控制文本的最大生成长度,值越大有助于生成较长或完整的回复;值较小,生成的内容越简洁。默认值为2048。

    说明:

    如果选择NLP模型-昇腾云类型的模型服务进行问答,建议设置模型生成最大新词数不超过512。

    非搜索增强模型生成多样性(temperature)

    控制非搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.8。

    搜索增强模型生成多样性(temperature)

    控制搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.3。

    文本重复度(presence_penalty)

    用于控制生成文本中特定单词或短语出现的频率。值越高生成的文本会使用更多样的单词和短语,减少重复性。默认值为0。

  2. 单击“确定”

体验问答

  1. “体验平台”页面右上角单击“问答”,切换至问答体验页面。
  2. 在输入框中输入问题,单击,查看返回的答案。
    图1 体验问答
    表2 图标说明

    图标

    说明

    认同内容,在对话框中输入正面反馈意见,单击“提交”

    不认同内容,在对话框中输入负面反馈意见,单击“提交”

    复制内容。

    刷新内容。

    查看答案参考源。在参考列表中,单击“阅读全文”,可查看文档原文。

    说明:

    当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。

查看历史对话

针对已进行的问答体验,可在对话历史页面查看历史对话记录。

  1. 在KooSearch控制台,左侧导航栏选择“对话管理 > 对话历史”
  2. “对话历史”页面,查看对话内容,单击操作列的“查看”进入对话详情页面。

    如果无需保留历史对话,可在对话历史页面单击操作列的“删除”,在对话框中单击“确认”删除指定的历史对话。

  3. 单击“搜索结果”,会弹出“参考列表”,单击“阅读全文”可查看文档原文。

    当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。

查看反馈意见

针对已进行意见反馈的问答,可在反馈管理页面查看和编辑意见反馈。

  1. 在KooSearch控制台,左侧导航栏选择“对话管理>反馈管理”
  2. “反馈管理”页面,可以查看反馈意见。
  3. 单击操作列的“编辑”,针对问答的相关内容,编辑意见内容。
  4. 单击“确定”,完成反馈意见的编辑。

相关文档