文档首页/ 华为云Astro轻应用/ 最佳实践/ 智能化专项/ 通过华为云Astro轻应用智能助手构建知识库
更新时间:2025-08-27 GMT+08:00

通过华为云Astro轻应用智能助手构建知识库

应用场景

对于查询文献资料的场景,当用户自身资料文档数量庞大,使用资料不方便、查询效率低下时,华为云Astro轻应用标准页面中的智能助手组件能够协助用户调用大模型接口获取答案。同时,通过RAG这个技术,结合知识库,为用户提供更为智能、自然的对话体验,提升信息检索的准确性和相关性。

约束与限制

  • 构建知识库功能受限使用,需要提交工单申请开通。
  • 知识库的目录结构必须为知识库 > 文件夹 > 文件。用户能够创建多个知识库,在每个知识库中可以创建多个文件夹,并在文件夹中上传不同类型的文件。华为云Astro轻应用专业版实例每个租户最多可创建40个文件夹,免费版标准版实例仅支持创建1个文件夹。上传单个文件时,单个文件的大小不能超过6MB。上传文件夹时,文件夹中文件的总大小不能超过50MB。上传文件的格式必须为TXT、DOCX、PDF、MD或CSV。

操作流程

华为云Astro轻应用中,通过智能助手构建知识库的流程,如图1所示。

图1 通过智能助手构建知识库操作流程

步骤一:创建大模型连接器对接外部大模型

在华为云Astro轻应用中,创建一个连接器来对接大模型接口。

  1. 创建一个低代码应用。

    1. 参考授权用户使用华为云Astro轻应用并购买实例中操作,申请华为云Astro轻应用免费试用或购买商业实例。
    2. 购买实例后,在华为云Astro轻应用服务控制台的“主页”中,单击“进入首页”,进入应用开发页面。
    3. “应用”中,单击“新建低代码应用”或单击,进入新建低代码应用页面。

      首次创建应用时,请根据界面提示创建一个命名空间。命名空间一旦创建,不能修改和删除,创建前请确认好相关信息。建议使用公司或团队的缩写作为命名空间。

    4. 在新建低代码应用页面,应用类型选择“标准应用”,单击“确定”
    5. 输入应用的标签和名称,单击“新建”,即可进入应用设计器。
      图2 创建一个空白应用
      表1 新建空白应用参数说明

      参数

      说明

      示例

      标签

      新建应用的标签,长度不能超过80个字符。标签是应用在系统中的唯一标识,创建后不支持修改。

      我的第一个应用

      名称

      新建应用的名称,输入标签值后单击该参数的输入框,系统会自动生成应用的名称,同时自动在名称前,添加命名空间__。命名要求如下:

      • 长度不能超过31个字符,包括前缀命名空间的长度。

        名称前的内容为命名空间,在华为云Astro轻应用中为了避免不同租户间数据的重名,租户在首次创建应用时需要先定义一个命名空间。一个租户只能创建一个命名空间,创建后不支持修改。

      • 必须以英文字母开头,只能由英文字母、数字或单下划线组成,且不允许以下划线结尾。

      A

  2. 创建大模型连接器。

    1. 在应用设计器中,选择“集成 > 连接器 > 连接器实例”
    2. 选择大模型 > 自定义大模型,单击“+”,进入创建自定义大模型连接器页面。
      图3 新建自定义大模型连接器
    3. 输入大模型连接器的配置信息,单击“保存”
      图4 设置大模型连接器信息
      表2 自定义大模型连接器参数说明

      参数

      说明

      示例

      标签

      自定义大模型连接器的标签,创建后可修改。

      取值范围:1~64个字符。

      DeepSeek-V3

      名称

      自定义连接器的名称,名称是连接器在系统中的唯一标识,创建后不可修改。命名要求如下:

      • 长度不能超过64个字符,包括前缀命名空间的长度。

        名称前的内容为命名空间,在华为云Astro轻应用中为了避免不同租户间数据的重名,租户在首次创建应用时需要先定义一个命名空间。一个租户只能创建一个命名空间,创建后不支持修改。

      • 必须以英文字母开头,只能由英文字母、数字或单下划线组成,且不能以下划线结尾。

      SelfHostDeepSeek

      模型名称

      具体大模型的模型标识。在调用该连接器时,会将此字段传递给大模型API中的model字段。

      DeepSeek-V3-0324-w8a8

      URL

      大模型提供方提供的大模型API调用地址。

      https://*****

  3. 测试大模型连接器的连通性。

    1. 在自定义大模型详情页面的“测试”中,单击“测试”,进入大模型连接器测试页面。
    2. “输入内容”中,输入对话内容(例如:你好),单击“测试”,查看返回消息是否正确响应。
      如果返回消息中有流式响应报文输出,说明大模型连接器配置成功。否则,请检查大模型连接器信息是否正确。
      图5 大模型连接器测试页面

步骤二:调用流式报文接口构建知识库

创建一个标准页面,并拖入一个智能助手组件,通过脚本调用流式报文接口构建知识库。

  1. 在应用设计器的左侧导航栏中,选择“界面”
  2. 单击页面后的“+”,创建一个空白的标准页面。

    图6 设置标准页面基本信息
    表3 标准页面参数说明

    参数

    说明

    示例

    标签

    输入标准页面的标签名,用于在页面显示,创建后可修改。

    取值范围:1~64个字符。

    知识库

    名称

    输入标准页面的名称,名称是标准页面在系统中的唯一标识,创建后不可修改。命名要求如下:

    • 长度不能超过64个字符,包括前缀命名空间的长度。

      名称前的内容为命名空间,在华为云Astro轻应用中为了避免不同租户间数据的重名,租户在首次创建应用时需要先定义一个命名空间。一个租户只能创建一个命名空间,创建后不支持修改。

    • 必须以英文字母开头,只能由英文字母、数字或单下划线组成,且不能以下划线结尾。

    knowledgebase

  3. 基本组件 > 智能化中,拖拽“智能助手”组件到右侧画布中。

    图7 添加智能助手组件

  4. 为智能助手组件添加开启知识库并绑定大数据模型。

    1. 选中智能助手组件,在属性 > 高级属性中,开启知识库。
      图8 开启知识库
    2. 开启大模型,并单击“设置默认模型”,选择步骤一:创建大模型连接器对接外部大模型中创建的连接器,完成模型的绑定。
      图9 为组件绑定模型

步骤三:验证智能助手是否可以正常构建知识库

  1. 在已创建的标准页面中,单击,进入预览页面,可查看到添加知识库按钮和绑定的大数据模型。
  2. 单击“添加知识库”,进入知识库页面,再单击“知识库管理”

    团队知识库是供团队成员共同使用的知识库。创建团队知识库时,如果“可见范围”设置为“团队内可见”,且“选择团队”选择了该用户所在的部门,则仅该部门的用户能够查看与使用该知识库。

    个人知识库主要由用户个人创建,也只能由用户个人使用,其余用户没有查看及使用该知识库的权限。

  3. 单击“创建知识库”,设置知识库的名称和可见范围,单击“确定”,返回知识库页面,可查看到已创建的知识库。

    图10 新建知识库
    表4 创建知识库参数说明

    参数

    说明

    示例

    知识库名称

    新建知识库的名称。

    常见问题知识库

    可见范围

    选择知识库的可见范围,支持团队内可见所有人可见

    • 团队内可见:仅该部门的用户能够查看与使用该知识库。
    • 所有人可见:该租户下的所有用户都能查看并使用该知识库。

    所有人可见

  4. 在知识库列表中,单击3中创建的知识库,进入知识库页面,单击“新建文件夹”

    图11 单击新建文件夹

  5. 设置文件夹名称,根据实际需求选择知识库Embedding模型、切分器和分段长度。

    图12 新建文件夹
    表5 新建文件夹参数说明

    参数

    说明

    示例

    文件夹名称

    新建文件夹的名称。

    高频常见问题

    Embedding模型

    选择Embedding模型,按需进行选择。

    • 中文文本嵌入模型:该模型适用于中英文文本的通用型768维度的嵌入模型。
    • 中文版文本表示模型:该模型适用于检索、分类、聚类或语义匹配等任务,目前仅支持中文文本。
    • 向量计算模型:该模型适用于中英文文本,在文本相似度计算中表现优异,模型维度364。
    • 华为自研代码专用模型:该模型在代码数据向量化、代码搜索任务中表现突出。

    中文文本嵌入模型

    切分器

    切分器用于将文本转换为模型能够理解的单元,支持如下几种类型:

    • 基于段落的切分器(默认使用):按照连续的两个换行符(\n\n)或文本段落结构进行分割。
    • 基于行的切分器:按照换行符(\n)进行分割。
    • 基于句子的切分器(适用于英文文本):将文本按照英文句子进行分割。
    • 基于字符的切分器:按照逐个字符(含空白字符)进行分割。

    基于段落的切分器

    分段预计长度

    分片的最长长度,取值范围为[50, 1200],默认值为1000。

    1000

    分段重叠长度

    当前分片与上一个分片重叠的文本长度,取值范围“0”到分片的长度的字符,默认值为0。

    0

    子切分器

    切片长度超过最大长度时应用子切分器,支持如下几种类型:

    • 基于字符的切分器(默认使用):按照逐个字符(含空白字符)进行分割。
    • 基于句子的切分器(适用于英文文本):将文本按照英文句子进行分割。
    • 基于单词的切分器(适用于英文文本):将文本按照空白字符进行分割。

    基于字符的切分器

  6. 设置完成后,单击“确定”,返回知识库页面。
  7. 单击已创建的文件夹(如高频常见问题),在文件夹中单击“上传文件”

    本实践以上传华为云Astro轻应用帮助中心的常见问题为例,单击华为云Astro轻应用 常见问题可下载该文档。

    图13 单击上传文件
    图14 上传常见问题文件

    文档上传后,文件“状态”“入库中”。单击按钮,刷新状态,当“状态”变为“入库成功”,说明文档可以正常使用。

  8. 返回知识库页面,选择已创建的知识库,您可以选择一个或多个知识库。

    图15 选择知识库

  9. 在智能助手中,提问华为云Astro轻应用常见问题中相关问题,可以检索到对应的文档。