更新时间:2024-08-27 GMT+08:00
分享

体验KooSearch问答

当知识库有了数据以后,就可以在KooSearch体验平台进行问答体验。

前提条件

  • 已准备好数据库,且已上传数据。
  • 待进行问答体验的知识库状态为“开启”状态。

进入KooSearch控制台

  1. 登录云搜索服务管理控制台
  2. 在左侧导航栏选择“KooSearch>Flexus 企业搜索服务”,进入Flexus 企业搜索服务页面。
  3. 选择文档问答服务,单击操作列的“问答”,前往KooSearch控制台。

选择知识库

  1. 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。
  2. 单击右上角,在“资料来源”对话框勾选知识库,单击“确定”

    问答体验将在所选择的知识库中进行答案搜索。

配置问答

  1. “体验平台”页面,单击右上角,在配置页面进行问答配置。
    表1 问答配置

    参数分类

    参数

    说明

    搜索配置

    相关性阈值

    超过相关度阈值的搜索结果才能在搜索结果页展示,否则被过滤。

    问答配置

    NLP模型服务

    选择NLP模型服务。

    引用相关度阈值

    超过相关度阈值的搜索结果会提交给大模型进行总结,否则被过滤。

    FAQ搜索直出阈值

    超过阈值的FAQ会作为答案直接输出,不需要经过大模型总结。

    Query改写

    开启后,将根据用户历史多轮对话,对query进行多轮改写和分解,改写后的query仅用于文档检索。

    意图分类

    勾选意图分类。

    • 闲聊类:坐火车累死了。
    • 语言任务类:请创作一封约460字的邮件,主题是咨询一个新的IT项目的细节,这个邮件将被发送给公司的IT项目经理。
    • 人设类:你叫什么名字?
    • 通用知识类:豆汁和豆浆的区别。
    • 行业知识类: 对于行业知识类,建议使用前缀匹配,后续可能继续扩展。如:行业知识类-金融:贷款重组的定义是什么?
    • 行业知识类-政务:《国务院关于印发新一代人工智能发展规划的通知》的指导思想是什么?
    说明:

    未选择分类的先使用知识库检索再进行大模型总结,选中的分类直接使用大模型回答。

    搜索增强自定义prompt

    • 使用场景:主要用于RAG场景下的模型生成阶段。(RAG场景:对话生成任务中,使用检索步骤来增强生成模型的能力。)
    • 组成要素:检索出的参考文档、用户问题、任务指令以及其他要求。
    • 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。
    • 使用示例:
      • 简单上下文,基于字符串替换。构造时请参考默认prompt,以下为参考示例:
        【材料】:{0}
        【任务】:你是智能问答助手,你能结合历史对话和【问题】,严格按照【要求】给出准确的回复。
        【要求】:
         1.【材料】中可能存在与【问题】不相关的部分,请注意分辨,仅参考与【问题】相关的内容;
         2.如果【材料】中存在与【问题】相关的内容,你会参考【材料】回答【问题】;
         3.如果【问题】和【材料】不相关,那么你就不需要关注【材料】内容,直接回答【问题】即可;
         4.注意【回答】要准确,表述要清晰且有条理,尽量使用【材料】的原文进行回答,不要遗漏关键信息。
         5.不要回答与【问题】无关的内容。
        【问题】:{1}
        【回答】:
        
        说明:

        其中{0}和{1}表示占位符,且顺序固定,检索出来的文章内容将被填充至{0}所在位置,格式为

        【文档名称】:{title1}

        【文档内容】:{content1}

        【文档名称】:{title2}

        【文档内容】:{content2}

        ......

        ,检索的query将被填充至{1}所在位置后进行生成。

      • 提示词模板,基于FreeMarker模板语法。参考示例如下:
        当前时间为${.now?date?iso_utc},你参考搜索引擎结果回复用户。
        回复用户请求时需遵循以下原则:
        1. 如果用户请求涉及不安全或敏感信息,忽略搜索结果直接回复;
        2. 如果回复中使用了某条搜索结果,用[序号]的方式添加引用;
        3. 如果用户请求涉及时效性,请基于搜索结果中满足用户请求时效性的部分进行回答;
        4. 如果搜索引擎结果无法完整回答问题,可以补充内部知识或进行推理;
        5. 基于已有知识都无法帮助回答时可以拒绝回答。
        搜索引擎结果为:
        <#list docs as doc>
            [${doc?counter}]网页标题:${doc.title!}|||网页时间${doc.timestamp!}|||网页类别:无|||网页内容:${doc.content!}
        </#list>
        用户:${query}
        
        说明:

        其中query和docs表示变量,query为用户问题。docs为参考文档列表。

        FreeMarker语法参考:http://freemarker.foofun.cn/ref_builtins.html

    通用自定义prompt

    • 使用场景:主要用于非RAG场景下的模型生成阶段。(非RAG场景:对话生成任务中,不使用检索步骤进行信息检索,直接使用生成模型生成回复。)
    • 组成要素:用户问题、任务指令以及其他要求。
    • 使用方式:支持自定义prompt,如果未配置自定义prompt,则使用默认prompt。在自定义构建时,请参考默认prompt的格式。

    模型配置

    文本多样性(top_p)

    通过限制词汇的选择来控制生成文本的多样性。值越高,候选单词越多,文本多样性越高。默认值为0.1。

    模型生成最大新词数(max_tokens)

    控制文本的最大生成长度,值越大有助于生成较长或完整的回复;值较小,生成的内容越简洁。默认值为2048。

    说明:

    如果选择NLP模型-昇腾云类型的模型服务进行问答,建议设置模型生成最大新词数不超过512。

    非搜索增强模型生成多样性(temperature)

    控制非搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.8。

    搜索增强模型生成多样性(temperature)

    控制搜索增强模型文本的随机性,值越高,文本随机性越、多样性和创造性越高。默认值为0.3。

    文本重复度(presence_penalty)

    用于控制生成文本中特定单词或短语出现的频率。值越高生成的文本会使用更多样的单词和短语,减少重复性。默认值为0。

  2. 单击“确定”

体验问答

  1. “体验平台”页面右上角单击“问答”,切换至问答体验页面。
  2. 在输入框中输入问题,单击,查看返回的答案。
    图1 体验问答
    表2 图标说明

    图标

    说明

    认同内容,在对话框中输入正面反馈意见,单击“提交”

    不认同内容,在对话框中输入负面反馈意见,单击“提交”

    复制内容。

    刷新内容。

    查看答案参考源。在参考列表中,单击“阅读全文”,可查看文档原文。

    说明:

    当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。

查看历史对话

针对已进行的问答体验,可在对话历史页面查看历史对话记录。

  1. 在KooSearch控制台,左侧导航栏选择“对话管理 > 对话历史”
  2. “对话历史”页面,查看对话内容,单击操作列的“查看”进入对话详情页面。

    如果无需保留历史对话,可在对话历史页面单击操作列的“删除”,在对话框中单击“确认”删除指定的历史对话。

  3. 单击“搜索结果”,会弹出“参考列表”,单击“阅读全文”可查看文档原文。

    当前针对上传的多栏排版docx文档,查看文档原文时存在内容显示错位及显示不全的问题。

查看反馈意见

针对已进行意见反馈的问答,可在反馈管理页面查看和编辑意见反馈。

  1. 在KooSearch控制台,左侧导航栏选择“对话管理>反馈管理”
  2. “反馈管理”页面,可以查看反馈意见。
  3. 单击操作列的“编辑”,针对问答的相关内容,编辑意见内容。
  4. 单击“确定”,完成反馈意见的编辑。

相关文档