通过华为云Astro轻应用智能助手构建知识库
应用场景
对于查询文献资料的场景,当用户自身资料文档数量庞大,使用资料不方便、查询效率低下时,华为云Astro轻应用标准页面中的智能助手组件能够协助用户调用大模型接口获取答案。同时,通过RAG这个技术,结合知识库,为用户提供更为智能、自然的对话体验,提升信息检索的准确性和相关性。
约束与限制
- 构建知识库功能受限使用,需要提交工单申请开通。
- 知识库的目录结构必须为知识库 > 文件夹 > 文件。用户能够创建多个知识库,在每个知识库中可以创建多个文件夹,并在文件夹中上传不同类型的文件。华为云Astro轻应用专业版实例每个租户最多可创建40个文件夹,免费版和标准版实例仅支持创建1个文件夹。上传单个文件时,单个文件的大小不能超过6MB。上传文件夹时,文件夹中文件的总大小不能超过50MB。上传文件的格式必须为TXT、DOCX、PDF、MD或CSV。
步骤一:创建大模型连接器对接外部大模型
在华为云Astro轻应用中,创建一个连接器来对接大模型接口。
- 创建一个低代码应用。
- 参考授权用户使用华为云Astro轻应用并购买实例中操作,申请华为云Astro轻应用免费试用或购买商业实例。
- 购买实例后,在华为云Astro轻应用服务控制台的“主页”中,单击“进入首页”,进入应用开发页面。
- 在“应用”中,单击“新建低代码应用”或单击
,进入新建低代码应用页面。
首次创建应用时,请根据界面提示创建一个命名空间。命名空间一旦创建,不能修改和删除,创建前请确认好相关信息。建议使用公司或团队的缩写作为命名空间。
- 在新建低代码应用页面,应用类型选择“标准应用”,单击“确定”。
- 输入应用的标签和名称,单击“新建”,即可进入应用设计器。
图2 创建一个空白应用
- 创建大模型连接器。
- 在应用设计器中,选择“集成 > 连接器 > 连接器实例”。
- 选择“+”,进入创建自定义大模型连接器页面。
图3 新建自定义大模型连接器
,单击
- 输入大模型连接器的配置信息,单击“保存”。
图4 设置大模型连接器信息
表2 自定义大模型连接器参数说明 参数
说明
示例
标签
自定义大模型连接器的标签,创建后可修改。
取值范围:1~64个字符。
DeepSeek-V3
名称
自定义连接器的名称,名称是连接器在系统中的唯一标识,创建后不可修改。命名要求如下:
SelfHostDeepSeek
模型名称
具体大模型的模型标识。在调用该连接器时,会将此字段传递给大模型API中的model字段。
DeepSeek-V3-0324-w8a8
URL
大模型提供方提供的大模型API调用地址。
https://*****
- 测试大模型连接器的连通性。
- 在自定义大模型详情页面的“测试”中,单击“测试”,进入大模型连接器测试页面。
- 在“输入内容”中,输入对话内容(例如:你好),单击“测试”,查看返回消息是否正确响应。
如果返回消息中有流式响应报文输出,说明大模型连接器配置成功。否则,请检查大模型连接器信息是否正确。图5 大模型连接器测试页面
步骤二:调用流式报文接口构建知识库
创建一个标准页面,并拖入一个智能助手组件,通过脚本调用流式报文接口构建知识库。
- 在应用设计器的左侧导航栏中,选择“界面”。
- 单击页面后的“+”,创建一个空白的标准页面。
图6 设置标准页面基本信息
- 在“智能助手”组件到右侧画布中。
中,拖拽图7 添加智能助手组件
- 为智能助手组件添加开启知识库并绑定大数据模型。
- 选中智能助手组件,在图8 开启知识库
中,开启知识库。
- 开启大模型,并单击“设置默认模型”,选择步骤一:创建大模型连接器对接外部大模型中创建的连接器,完成模型的绑定。
图9 为组件绑定模型
- 选中智能助手组件,在
步骤三:验证智能助手是否可以正常构建知识库
- 在已创建的标准页面中,单击
,进入预览页面,可查看到添加知识库按钮和绑定的大数据模型。
- 单击“添加知识库”,进入知识库页面,再单击“知识库管理”。
团队知识库是供团队成员共同使用的知识库。创建团队知识库时,如果“可见范围”设置为“团队内可见”,且“选择团队”选择了该用户所在的部门,则仅该部门的用户能够查看与使用该知识库。
个人知识库主要由用户个人创建,也只能由用户个人使用,其余用户没有查看及使用该知识库的权限。
- 单击“创建知识库”,设置知识库的名称和可见范围,单击“确定”,返回知识库页面,可查看到已创建的知识库。
图10 新建知识库
表4 创建知识库参数说明 参数
说明
示例
知识库名称
新建知识库的名称。
常见问题知识库
可见范围
选择知识库的可见范围,支持团队内可见和所有人可见。
- 团队内可见:仅该部门的用户能够查看与使用该知识库。
- 所有人可见:该租户下的所有用户都能查看并使用该知识库。
所有人可见
- 在知识库列表中,单击3中创建的知识库,进入知识库页面,单击“新建文件夹”。
图11 单击新建文件夹
- 设置文件夹名称,根据实际需求选择知识库Embedding模型、切分器和分段长度。
图12 新建文件夹
表5 新建文件夹参数说明 参数
说明
示例
文件夹名称
新建文件夹的名称。
高频常见问题
Embedding模型
选择Embedding模型,按需进行选择。
- 中文文本嵌入模型:该模型适用于中英文文本的通用型768维度的嵌入模型。
- 中文版文本表示模型:该模型适用于检索、分类、聚类或语义匹配等任务,目前仅支持中文文本。
- 向量计算模型:该模型适用于中英文文本,在文本相似度计算中表现优异,模型维度364。
- 华为自研代码专用模型:该模型在代码数据向量化、代码搜索任务中表现突出。
中文文本嵌入模型
切分器
切分器用于将文本转换为模型能够理解的单元,支持如下几种类型:
- 基于段落的切分器(默认使用):按照连续的两个换行符(\n\n)或文本段落结构进行分割。
- 基于行的切分器:按照换行符(\n)进行分割。
- 基于句子的切分器(适用于英文文本):将文本按照英文句子进行分割。
- 基于字符的切分器:按照逐个字符(含空白字符)进行分割。
基于段落的切分器
分段预计长度
分片的最长长度,取值范围为[50, 1200],默认值为1000。
1000
分段重叠长度
当前分片与上一个分片重叠的文本长度,取值范围“0”到分片的长度的字符,默认值为0。
0
子切分器
切片长度超过最大长度时应用子切分器,支持如下几种类型:
- 基于字符的切分器(默认使用):按照逐个字符(含空白字符)进行分割。
- 基于句子的切分器(适用于英文文本):将文本按照英文句子进行分割。
- 基于单词的切分器(适用于英文文本):将文本按照空白字符进行分割。
基于字符的切分器
- 设置完成后,单击“确定”,返回知识库页面。
- 单击已创建的文件夹(如高频常见问题),在文件夹中单击“上传文件”。
本实践以上传华为云Astro轻应用帮助中心的常见问题为例,单击华为云Astro轻应用 常见问题可下载该文档。
图13 单击上传文件图14 上传常见问题文件文档上传后,文件“状态”为“入库中”。单击
按钮,刷新状态,当“状态”变为“入库成功”,说明文档可以正常使用。
- 返回知识库页面,选择已创建的知识库,您可以选择一个或多个知识库。
图15 选择知识库
- 在智能助手中,提问华为云Astro轻应用常见问题中相关问题,可以检索到对应的文档。