- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
- AppStage使用前准备
- AI原生应用引擎用户指南
- 开发中心用户指南
-
运维中心用户指南
- 运维中心简介
- 运维中心使用前准备
- 运维中心使用流程
- 进入运维中心
- 接入资源
- 部署应用
- 监控资源和应用
- 管理已纳管资源
- 管理运行时资源
- 管理工单
- 运营中心用户指南
- 最佳实践
- 开发指南
- API参考
- SDK参考
-
常见问题
- 权限管理
-
AI原生应用引擎
- 我创建的微调数据集会被其他用户调用去训练他们的大模型吗?
- 模型微调任务一直在等待中是什么原因?
- 大模型微调需要的数据有要求吗?
- AI原生应用引擎支持所有数据集进行数据标注吗?
- AI原生应用引擎中预置了哪些提示语?
- AI原生应用引擎训练好后的模型如何获取?
- 模型调测时,无法选择模型服务商API是什么原因?
- 我接入的模型需要满足什么要求才能在创建Agent时作为思考模型?
- Agent问答的时候报错“很抱歉,我的系统似乎遇到了一些故障问题,暂时无法为您提供服务”
- 自接入的模型在模型调测的时候报错是什么原因?
- 开源模型怎么部署?
- 平台有没有预置模型?
- 思考模型和问答模型的区别
- 工作流中知识库节点、LLM节点都需要配置实例,实例的API Key填什么?
- 工作流中工具节点的实例如何配置?
- 如何获取Agent发布时所需的API Key?
- 如何保证Agent每次问答都调用知识库?
- 工作流的返回是json格式,但是大模型会进行总结,如何以json格式直接输出?
- 如何在工作流中定制逻辑实现特定任务,比如时间格式转换、数组对象的push等
- 资产中心的工具怎么使用?
- Code代码节点的输入输出参数如何与其他节点进行交互和传递?
- Agent问答的时候没有回答
- 发布Agent的时候提示套餐校验失败
- 一站式创建Agent时如何取消选择默认模型,更换为其他模型
- 按照标题切分的时候,分段长度是什么意思?
- 工作流已启用,为什么在创建Agent时仍然无法选用?
- 如何通过调用Agent API将变量传递到工作流?
- 开发中心
- 运维中心部署服务
-
运维中心监控服务
- 如何查看EAP详细日志?
- 删除告警任务失败
- 告警后触发知识编排任务提示alert_type不存在
- 创建CES指标采集报错
- 如何卸载虚拟机上安装的filebeat?
-
异常检测Judge定时任务失败
- KeyError
- TypeError: not supported between instances of 'str' and 'float'
- TypeError("Cannot index by location index with a non-integer key")
- judge长时间处于SUBMIT状态直至失败
- fail to load model json
- judge日志无法查看,提示get request error
- judge日志大小1KB,且不刷新日志内容
- PSQLException: ERROR: invalid input syntax for type numeric
- PSQLException: ERROR: syntax error at or near
- too much null size
- judge_data_size(in):0
- ERROR - fail to load
- canceling statement due to user request
- 保存异常检测告警配置时报错
- 运维中心弹性资源服务
- 运维中心弹性网络服务
- 运维中心主机管理服务
- 运维中心微服务平台
-
运维中心负载均衡
-
SLB同步异常相关问题
- SSL_do_handshake() failed
- test nginx: nginx: [emerg] host not found in upstream "后端服务器名称" in /.../server...conf:17 nginx: .../nginx.conf test failed [FAILED
- no "ssl_certificate" is defined for the "listen ... ssl""
- no such file or directory......./ssl/dummy.pem
- test nginx: nginx: [alert] mmap(MAP_ANON|MAP_SHARED, 524288000) failed (12: Cannot allocate memory) nginx: [alert] munmap(FFFFFFFFFFFFFFFF, 524288000) failed
- duplicate value "error" in /opt/huawei/openresty/nginx/.../xxx.conf:40
- SLB同步检查不一致
- SLB一直同步,心跳异常
-
SLB部署失败相关问题
- FATAL Can't get local ip
- /etc/rc.d/init.d/functions: No such file or directory
- nginx is stopped
- will_upgrade\old_version:1.4.7
- Need to modify /etc/hosts,but no permission.
- system param fs.nr_open should not less than fs.file-max”or“system param net.ipv4.ip_local_port_range should >=30000
- some permission denied files in /opt/huawei/openresty/nginx/conf/
- Permission denied: '/opt/huawei/release/lf_test/SLB/
- install_slb_failed for /opt/huawei/openresty exists not for slb
- not all conf included in vhosts or slb_conf
- watchdog still running
- job 28e7241e42904334b failed
- [Service proxy.apply_sudo._wrapped_f]: fail to operator sudo,message: send request fail, status code: 400, error: None, message: illegal param\",\"status\":-2}
- some html not in /opt/huawei/openresty/nginx/html
- cannot access /opt/huawei/openresty/nginx/conf/ssl/sample/resty-auto-ssl-fallback.pem.Permission denined
- fail to operator sudo, message: send request fail, status code: 400, task: control sudo permission, status: failed
- some certificate not in /opt/huawei/openresty/nginx/conf/ssl
- crontab -l \n+ echo 'Permission denied crontab'
- 资源间绑定服务不一致
-
SLB同步异常相关问题
- 运维中心数据库治理
- 运维中心访问凭据管理服务
- 运营中心
- 管理控制台用户指南(即将下线)
- 业务控制台用户指南(即将下线)
-
运行时引擎用户指南(即将下线)
- AppStage运行时引擎简介
- AppStage运行时引擎使用前准备
- 进入AppStage运行时引擎
- 通过微服务平台管理微服务及相关资源
- 配置运行时引擎负载均衡
- 管理Cloud Map中的服务资源
- 配置运行时引擎数据库治理
- 配置访问凭据管理服务
- 文档下载
- 通用参考
链接复制成功!
创建知识库
知识库是一个组织、存储及管理知识的系统,包括文档、数据库、图表、表格等多种形式的信息的分类、整理和归纳,可以帮助用户组织和管理大量的信息,以便快速访问和使用,平台为用户提供了创建并管理知识库的能力,且创建的知识库启用后可在创建Agent时引用。
前提条件
- 通过OBS接入数据时,操作账号需获得OBS(对象存储服务)只读权限,具体操作请参见对其他账号授予桶的读写权限。
- 需具备充足的知识库容量包资源(包含OBS存储配额和向量库存储配额,两者比例为5:1),每个租户默认1G的向量库存储配额,默认配额用完后,请参考购买AppStage购买知识库容量包。
- 需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
创建知识库
- 在AI原生应用引擎的左侧导航栏选择“知识中心 > 知识库”,单击“创建知识库”。
- 在“创建知识库”页面,参照表1进行基础配置,并根据选择的数据来源进行源数据接入配置或添加知识数据集。
表1 知识库基础配置参数说明 参数名称
参数说明
知识库名称
自定义知识库的名称,支持中英文、数字、下划线(_),长度2-50个字符,以中英文、数字开头。
知识库描述
知识库的相关信息描述。只能包含英文、中文、数字、下划线、中划线、空格及,.?:;"':;“”’‘,。?、()()/
RAG类型
GraphRAG类型仅支持用于“文档”类型的数据。
- VectorRAG:向量RAG,是一种结合了向量化和大语言模型的RAG技术。VectorRAG将非结构化的数据转化为结构化的向量空间,利用向量库实现高效的信息检索。
- GraphRAG:知识图谱RAG,是一种结合了知识图谱和大语言模型的RAG技术。GraphRAG能够处理各种类型的文档,从中提取实体(文档中具体的对象或概念)、关系以及文本内容构建知识图谱(一种结构化的知识表示方式),从而增强大语言模型对复杂信息的理解和推理能力。
数据来源
知识库的数据来源。
数据类型
当数据来源为“接入源数据”时,配置此参数。
支持接入的源数据类型:
- 文档:支持.pdf、.txt(只支持UTF-8)、.csv(只支持UTF-8)、.xlsx、.docx、.pptx、.html、.json、.xml、.md格式,单个文件最大为10M,总上传大小最大为500M。
- 图片:支持.png、.jpg、.jpeg、.gif、.webp、.bmp格式,单张图片最大为10M,总上传大小最大为200M。
- 图片-摘要:支持本地文件上传.png、.jpg、.jpeg、.gif、.webp、.bmp格式,需对图片填写摘要信息,单张图片最大为10M,总上传大小最大为300M。
- 视频-摘要:支持本地文件上传.mp4、.webm、.wmv、.mov、.avi格式,需对视频填写摘要信息,单个视频最大为100M,总上传大小最大为300M。
表2 接入源数据参数说明 参数名称
参数说明
数据接入
接入方式
选择数据集的接入方式。支持以下两种方式:
数据文件
当接入方式选择“本地上传”时,需配置此参数。
单击“文件上传”选择本地文件进行上传,支持上传的文件类型请参考表1的“数据类型”。
文件类型
- 当接入方式选择“本地上传”时,无需配置,根据上传的文件自动识别文件类型。
- 当接入方式选择“OBS接入”时,选择接入的文档、图片的格式。
OBS桶名
当接入方式选择“OBS接入”时,需配置此参数。
在下拉列表中选择数据所在的OBS桶名。
OBS路径
当接入方式选择“OBS接入”时,需配置此参数。
在下拉列表中选择数据所在的具体OBS路径。
调度类型
当接入方式选择“OBS接入”时,需配置此参数。
可选如下两种类型:
- 一次性调度
- 定时调度
版本更新模式
当“调度类型”选择“定时调度”时,需配置此参数。
- 覆盖模式:每次调度成功,会覆盖唯一的版本。
- 多版本模式:当OBS桶内内容发生变化时,调度成功后会生成一个新版本。
执行周期
当“调度类型”选择“定时调度”时,需配置此参数。
设置执行周期,支持选择为天、周。
执行时间
当“调度类型”选择“定时调度”时,需配置此参数。
- 当执行周期为“天”时,设置每日开始执行的时间。
- 当执行周期为“周”时,指定每周周几,并设置当日开始执行的时间。
立即执行
当“调度类型”选择“定时调度”时,需配置此参数。
选择是否立即执行。
数据加工
数据清洗(可选)
数据类型选择为“文档”、“图片-摘要”、“视频-摘要”时,显示此参数。
在下拉列表可选以下(支持多选):
- 清除URL和邮件地址
- 清除连续的空格,换行符和制表符
- 清除不可见字符
- 规范化空格
- 清除乱码
- 清除网页标识符
- 清除表情
PDF预处理
当接入的文档类型为.pdf时,显示此参数。
- 提取PDF富媒体:提取PDF文件中的富媒体(图片、表格等)。
- 无处理
智能匹配图表
当“PDF预处理”选择为“提取PDF富媒体”时,显示此参数。
数据切分时,有助于对PDF文件中的图片、表格进行完整提取。
数据切分
数据类型选择为“文档”时,显示此参数。
为各文档格式选择一种切分方式,默认为自动切分。
- 自动切分:按照系统默认预设的规则和分隔符切分。
- 标题切分:按标题级别分块,分块后的内容按照自定义规则切分(仅docx格式的文档支持标题切分)。
- 自定义切分:自定义分段规则,分隔符,以及分段长度等参数。
标题层级深度
数据切分模式为“标题切分”时,需配置此参数。
例如文本包含最多5级标题,选择的标题层级深度为3,则会分别将所有3级标题下的内容合并成文本块,文本块作为一个整体执行后续切分操作。
标题保存方式
数据切分模式为“标题切分”时,需配置此参数。
- 多标题组合:多级标题用特定符号组合:1级标题-2级标题-3级标题-…-文本
- 最后一级标题:仅组合最后一级标题:最后一级标题-文本
文本切分策略
数据切分模式为“自定义切分”、“标题切分”时,需配置此参数。在下拉列表可选以下策略:
- 递归切分:所选分隔符先后作为优先级顺序,优先高的先切分,切分后大于最大长度的分段再用优先级低的分隔符切分,如此往复。
- 等价切分:分隔符无优先级,使用所选的所有分隔符切割,合并至分段最大长度。
分段分隔符
数据切分模式为“自定义切分”、“标题切分”时,需配置此参数。
设置用于文本分段的分隔符号。输入的分隔符不允许包含以下特殊字符*./$^?+以及带有\的分隔符,仅支持输入\n,用于表示按行分隔,其它诸如\\n,\n\n等均不支持。
包含分隔符
切分后的分段内容中是否包含分隔符,选择“包含”或“不包含”。
分段长度
数据切分模式为“自定义切分”、“标题切分”时,需配置此参数。
用于设置文本分段后每段的长度。
分段重叠长度
数据切分模式为“自定义切分”、“标题切分”时,需配置此参数。
用于设置当前分段开头与上一个分段结尾重叠部分的长度。
索引配置
向量化模型
选择向量化模型,向量化模型可以将文本数据转换为数值向量,常用于将文本转换为机器可以处理的形式,以便进行各种任务,如文本分类、情感分析、机器翻译等。
当前模型仅支持向量化512 token的内容,对应的中文约为512个字,英文与符号约900个字符,请注意分片长度。
长文本策略
- 默认模式:如果待向量化分片字段token长度超过了向量化模型限制的token总数,则创建知识库失败。
- 截断模式:如果待向量化分片字段token长度超过向量化模型限制的token总数,则进行截断,取前top k个token。
- 智能模式:如果待向量化分片字段token超过向量化模型限制的token总数,首先利用对话大模型对超长分片进行重写,如果仍然超长则进入截断模式。
检索配置
当RAG类型为“VectorRAG”时,支持配置此参数;RAG类型为“GraphRAG”时,默认为“语义检索”方式。
检索方式
当数据类型为“图片”时,不支持选择混合检索和全文检索。
- 混合检索:同时使用语义检索与全文检索,并对结果进行综合排序。
- 语义检索:使用向量进行文本语义查询,即调用向量数据库根据向量的相似性检索。
- 全文检索:使用关键字进行文本匹配,适合查找一些关键词和主题语的数据。
知识图谱配置
当RAG类型为“GraphRAG”时,需要配置此参数。
实体抽取模型
选择实体抽取模型。从文本中提取实体(文档中具体的对象或概念)、关系以及文本内容,用于构建知识图谱。
实体抽取提示语
- 默认:模型按照默认的提示语要求,对文本内容进行抽取。
- 自定义:对默认的提示语进行编辑,自定义实体抽取方式。
高级配置
开启“高级配置”开关,可以对已切分好的分片,提取相关内容作为检索字段、文本过滤字段或向量化字段。
切片提取模式
数据类型选择为“文档”时,显示此参数。
- 智能提取:通过大语言模型提取分片内的问题与回答,效果由大模型决定。目前仅支持提取问题和答案,且耗时较长。
- 规则提取:按照用户配置的提取规则对切片内容进行提取。
切片内容示例
数据类型选择为“文档”时,显示此参数。
切片内容示例,用以测试切片提取效果。
切片提取配置
切片提取模式为“规则提取”时,配置此参数。
单击“添加提取字段”,配置如下参数:
- 切片片段名称:自定义切片片段名称。
添加的提取字段数量不超过10个,切片片段名称长度最多为20个字符,不允许重复,不允许为以下名称(大小写不敏感):file_name、file_id、path、order、document、base64、chunk,不能以ki_、ko_开头,仅可包含字母、数字、下划线,并且以字母开头。
- 提取规则:分隔符提取、按规则提取。
- 提取设置
- 当提取规则为“分隔符提取”时,例如:以分隔符;对切片进行分段,选择第2个分段,片段中不包含分隔符。
输入的分隔符不允许包含以下特殊字符*./$^?+以及带有\的分隔符,仅支持输入\n,用于表示按行分隔,其它诸如\\n,\n\n等均不支持。
在填写“选择第{{片段序号}}个片段”时,如果此处的片段序号超出片段数量,则提取内容为空。
- 当提取规则为“按规则提取”时,例如:从切片提取以项目名称:开头和以(完)结尾的片段,选择第3个片段,片段中包含开头,不包含结尾。
- 当提取规则为“分隔符提取”时,例如:以分隔符;对切片进行分段,选择第2个分段,片段中不包含分隔符。
切片提取效果
数据类型选择为“文档”时,显示此参数。
展示对切片内容提取后的效果。
索引字段配置
- 当RAG类型为“VectorRAG”时 ,配置如下参数:
- 检索字段:选择对哪个字段进行检索,并作为检索命中内容返回。
- 文本过滤字段:选择哪些字段支持在检索时同步进行文本过滤,并返回该字段的内容。
- 附加返回字段:选择哪些字段在检索时附加返回。
- 当RAG类型为“GraphRAG”时 ,配置如下参数:
- 实体抽取字段:选择对哪个字段进行实体抽取。选择从chunk抽取实体时,chunk是一个完整切片,是指从这个切片的内容里面去抽取实体。
- 附加返回字段:选择哪些字段在检索时附加返回。
- 单击“保存”,保存知识库的参数配置。
单击“保存并启用”,创建知识库完成并启用该知识库。
命中测试
命中测试即测试检索的命中率。
- 在知识库列表中,单击操作列的“命中测试”。
- 在命中测试页面,配置测试输入参数,参数说明如表4所示,配置完单击“测试”。
- 在“测试结果”区域查看测试效果,测试结果根据相似度从大到小进行排序。
- 在“测试历史”区域查看该知识库的测试历史记录,每个知识库测试记录最多保留50条。
更多操作
创建知识库完成后,可执行如下表5所示的管理知识库相关操作。
操作 |
说明 |
---|---|
查看知识库详情 |
在知识库列表中单击知识库名称,进入知识库详情页,可查看该知识库数据基础信息、调度历史,并支持进行知识库溯源。 |
修改知识库 |
不支持修改已启用的知识库,如需删除,请先进行停用。
|
删除知识库 |
不支持删除已启用的知识库,如需删除,请先进行停用。
|
启用知识库 |
在知识库列表中,对于已停用的知识库,可在“操作”列单击“启用”将其重新启用,启用后的知识库才可在创建Agent时引用。 |
停用知识库 |
在知识库列表中,对于已启用的知识库,可在“操作”列单击“停用”将其暂停使用。 |
执行知识库调度 |
当自动调度失败或知识库配置更改时,可以手动执行调度,更新知识库。当数据集更新时,系统会自动执行知识库调度,无需手动执行调度。 在知识库列表中,选择“操作”列的“更多 > 执行”,手动执行知识库调度。 |