- 最新动态
- 功能总览
- 服务公告
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- CSS服务权限管理
-
使用Elasticsearch搜索数据
- Elasticsearch使用流程
- Elasticsearch集群规划建议
- 创建Elasticsearch集群
- 访问Elasticsearch集群
- 导入数据至Elasticsearch集群
- 使用Elasticsearch集群搜索数据
- 增强Elasticsearch集群搜索能力
- 配置Elasticsearch集群网络
- 备份与恢复Elasticsearch集群数据
- 扩缩容Elasticsearch集群
- 升级Elasticsearch集群版本
- 管理Elasticsearch集群
- 管理Elasticsearch集群索引策略
- Elasticsearch集群监控与日志管理
- 查看Elasticsearch集群审计日志
- 使用OpenSearch搜索数据
- 使用Logstash迁移数据
- CSS服务资源监控
- 最佳实践
- API参考
- SDK参考
- 场景代码示例
-
常见问题
- 产品咨询
- 计费相关
- CSS集群访问
- CSS集群迁移
-
CSS集群搜索引擎使用
- CSS服务中为什么新创建的索引分片集中分配到单节点上?
- CSS服务中Elasticsearch 7.x集群如何在index下创建type?
- CSS服务中如何配置Elasticsearch索引副本数量?
- CSS服务中Elasticsearch集群分片过多会有哪些影响?
- 如何查看CSS集群的分片数以及副本数?
- CSS服务中Elasticsearch集群的节点node.roles为i表示什么意思?
- CSS服务中如何设置Elasticsearch集群的默认分页返回最大条数?
- CSS服务中如何更新Elasticsearch生命周期策略?
- CSS服务中如何设置Elasticsearch集群慢查询日志的阈值?
- CSS服务中如何清理Elasticsearch索引数据?
- CSS服务中如何清理Elasticsearch缓存?
- 使用delete_by_query命令删除Elasticsearch集群数据后,为什么磁盘使用率反而增加?
- CSS服务的Elasticsearch集群是否支持script dotProduct?
-
CSS集群管理
- 如何查看CSS集群所分布的可用区?
- CSS服务中Filebeat版本与集群版本的关系是什么?
- 如何获取CSS服务的安全证书?
- CSS服务中如何转换CER安全证书的格式?
- CSS服务中Elasticsearch和OpenSearch集群支持修改安全组吗?
- CSS服务中Elasticsearch集群如何设置search.max_buckets参数?
- CSS服务中如何修改Elasticsearch和OpenSearch集群的TLS算法?
- CSS服务中如何开启Elasticsearch和OpenSearch集群的安全审计日志?
- CSS服务中是否支持停止集群?
- CSS集群冻结索引后如何查询OBS上的索引占用量?
- 如何查看Elasticsearch和OpenSearch集群的系统默认插件列表
- CSS集群备份与恢复
- CSS集群监控与运维
-
故障排除
-
访问集群类
- 无法正常打开Kibana
- Elasticsearch针对filebeat配置调优
- Spring Boot使用Elasticsearch出现Connection reset by peer问题
- 为什么集群创建失败
- Elasticsearch集群出现写入拒绝“Bulk Reject”,如何解决?
- Elasticsearch集群创建index pattern卡住,如何解决?
- 云搜索控制台页面提示系统繁忙
- Elasticsearch集群报错:unassigned shards all indices
- es-head插件连接Elasticsearch集群报跨域错误
- 单节点集群打开Cerebro界面显示告警
- ECS无法连接到集群
- 集群不可用
- 数据导入导出类
-
功能使用类
- 无法备份索引
- 无法使用自定义词库功能
- 快照仓库找不到
- 集群一直处于快照中
- 数据量很大,如何进行快照备份?
- 集群突现load高的故障排查
- 使用ElasticSearch的HLRC(High Level Rest Client)时,报出I/O Reactor STOPPED
- Elasticsearch集群最大堆内存持续过高(超过90%)
- Elasticsearch集群更改规格失败
- 安全集群索引只读状态修改报错
- Elasticsearch集群某一节点分配不到shard
- 集群索引插入数据失败
- CSS创建索引报错“maximum shards open”
- 删除索引报错“403 Forbidden”是什么原因?
- Kibana中删除index pattern报错Forbidden
- 执行命令update-by-query报错“Trying to create too many scroll contexts”
- Elasticsearch集群无法创建pattern
- 端口访问类
-
访问集群类
- 视频帮助
- 文档下载
- 通用参考
链接复制成功!
基于KooSearch和DeepSeek构建知识问答
本文结合KooSearch和DeepSeek模型搭建一个基于RAG( Retrieval Augmented Generation)的知识问答系统。针对NLP大模型存在的知识幻觉、知识更新不及时以及缺乏企业专业知识等问题,大模型+知识库是当前普遍采用的解决方案。
KooSearch基于RAG架构,支持导入非结构化或结构化的业务数据到知识库,帮助企业客户快速、一站式地搭建企业智能问答应用。通过搜索增强大模型,数据来源于搜索,解决了大模型幻觉的问题,生成的问答结果更加可靠和安全。同时,您可以灵活配置LLM大语言模型,支持选择部署在ModelArts Studio大模型即服务平台(后续简称为MaaS)上的开源大模型,如DeepSeek模型。
应用场景
在人工智能应用中,RAG技术逐渐成为提升智能系统性能的关键手段。RAG结合了检索(Retrieval)和生成(Generation)的能力,通过检索相关知识并结合生成模型输出高质量结果。DeepSeek V3作为一款强大的开源大语言模型,特别适合用于构建RAG系统。
方案优势
- 强大的知识检索与生成能力
DeepSeek V3拥有671B总参数和37B激活参数,经过14.8T高质量token的预训练,在知识类任务、长文本处理、代码生成和数学推理等多个领域表现突出。这使得RAG系统能够从大规模知识库中高效检索相关信息,并生成高质量、准确的答案。
- 高效的推理与训练优化能力
DeepSeek V3的推理速度可达60TPS,相比前代模型大幅提升,这使得RAG系统在处理复杂任务时能够快速响应,提升用户体验。
- 开源与可扩展性
DeepSeek V3完全开源,代码和模型权重易获取。这种开放性使得开发者方便对模型进行定制和优化,轻松扩展到新的知识领域。此外,其开源特性也降低了部署成本。
约束限制
仅“西南-贵阳一”区域支持开通和使用KooSearch服务。KooSearch是白名单功能,如果有试用需求,请提工单申请权限。
前提条件
- 在云搜索服务管理控制台已创建一个KooSearch文档问答服务。
- 已完成MaaS服务的访问授权,请参见配置MaaS访问授权。
步骤一:获取DeepSeek模型
在MaaS服务中获取DeepSeek模型服务,并记录API地址、模型名称和API Key,用于接入KooSearch。
- 登录ModelArts管理控制台,区域选择“西南-贵阳一”。
- 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。
- 在ModelArts Studio左侧导航栏中,选择“模型部署 > 预置服务”进入服务列表。
- 在预置服务列表,选择DeepSeek系列的模型服务,单击操作列的“领取”获取DeepSeek模型的免费Token额度。
图1 获取DeepSeek模型服务
- 选择已领取的DeepSeek模型服务,单击操作列的“调用”,获取并记录“API地址”和“模型名称”。
图2 获取DeepSeek模型服务的信息
- 在调用页面,单击“管理API Key”跳转到鉴权管理页面。单击“创建API Key”,填写描述信息后,单击“确认”会返回“您的密钥”,请复制保存密钥,单击“关闭”后将无法再次查看密钥。
说明:
- 最多支持创建5个密钥,密钥只会在新建后显示一次,请妥善保存。
- 当密钥丢失将无法找回,请新建API Key获取新的访问密钥。
步骤二:KooSearch对接公网
通过配置NAT网关和弹性公网IP将KooSearch对接到公网,便于接入MaaS服务中的DeepSeek模型服务。
- 登录NAT网关管理控制台。
- 在公网NAT网关列表页面,单击“购买公网NAT网关”,进入购买公网NAT网关页面。
- 在购买公网NAT网关页面,配置NAT网关。
关键参数请参见表1配置,其他参数可以保持默认值或基于业务场景配置。
- 单击“立即购买”,确认产品规格无误后,单击“提交”,开始创建公网NAT网关。当状态为“运行中”时,表示公网NAT网关创建成功。
- 当公网NAT网关创建成功后,在公网NAT网关列表页面,单击操作列的“设置规则”,在弹窗中单击“添加规则”进入网关详情页的“SNAT规则”页面。
- 在“SNAT规则”页面,单击“添加SNAT规则”,在弹窗中配置公网NAT网关的SNAT规则。
表2 添加SNAT规则 参数
说明
使用场景
选择“虚拟私有云”。
网段
选择“使用已有”,选择和KooSearch同一个VPC。
公网IP类型
选择“弹性公网IP”,勾选满足要求的IP。
如果没有可选的弹性公网IP,可以单击“查看弹性公网IP”跳转到弹性公网IP列表页,申请弹性公网IP。
弹性公网IP的建议配置如下:
- “计费模式”:“按需计费”
- “公网带宽”:“按流量计费”
- “带宽大小”:“20”
- 单击“确定”完成SNAT规则的添加。
步骤三:在KooSearch接入DeepSeek模型
将MaaS服务中获取的DeepSeek模型服务接入KooSearch。
- 登录云搜索服务管理控制台。
- 在左侧导航栏选择“KooSearch > KooSearch文档问答”,进入KooSearch服务列表。
- 单击KooSearch服务名称,进入服务详情页。
- 给KooSearch配置集群路由,使KooSearch能够通过公网接入DeepSeek。
- 在服务详情页,单击“集群路由”后面的“修改”。
- 在“修改集群路由”弹窗中,配置路由信息。
表3 配置集群路由 参数
说明
ip地址
填写MaaS服务中DeepSeek模型服务的IP地址。
获取方式:在执行机ping DeepSeek模型服务的域名,解析后即可获得IP地址。例如获取到的DeepSeek模型服务的API地址是“https://example.example.com/v1/infers/xxxx”,则域名是“example.example.com”,在执行机执行命令ping example.example.com,回显如下,则表示IP地址是“xxx.xxx.xxx.xxx”。
正在 Ping example.example.com [xxx.xxx.xxx.xxx] 具有 32 字节的数据: 来自 xxx.xxx.xxx.xxx 的回复: 字节=32 时间=33ms TTL=55
子网掩码
填写“255.255.255.255”。
更改类型
选择“添加”。
- 单击“确定”完成集群路由配置。
- 返回KooSearch服务列表,选择服务,单击操作列的“问答”,前往KooSearch控制台。
- 创建模型服务,接入DeepSeek。
- 在KooSearch左侧导航栏选择“模型管理”,进入“模型管理”页面。
- 单击页面的“新建模型服务”,弹出新建模型服务页面。
图3 新建模型服务
- 在新建模型服务页面,配置模型服务。
表4 新建模型服务 参数
说明
模型服务名称
自定义模型服务名称,不能为空。
模型类型
选择“NLP模型-昇腾云”,表示通过昇腾云的MaaS服务提供的NLP大模型访问方式。
访问地址
填写MaaS服务中DeepSeek模型服务的“API地址”。获取方式请参见步骤一:获取DeepSeek模型。
模型描述
模型详细信息的描述。
昇腾云模型名称
填写MaaS服务中DeepSeek模型服务的“模型名称”,获取方式请参见步骤一:获取DeepSeek模型。
上下文长度(K)
NLP大模型在进行一次特定的推理时可以考虑的最大令牌数。可以扩展上下文以生成更全面的响应。
认证类型
勾选“自定义认证”,添加自定义请求头。“标头键”填写“Authorization”,“标头值”填写“Bearer+DeepSeek的API Key”,例如获取到的API Key为“abcdef”,则此处填写“BearerABCDEF”。MaaS服务中DeepSeek模型服务的API Key获取方式请参见步骤一:获取DeepSeek模型。
- 单击“确定”创建模型服务。当模型“连通性”显示“正常”时,表示模型对接成功。
体验知识问答
- 创建知识库。
- 在KooSearch控制台的左侧导航栏选择“知识库管理”,进入知识库管理页面。
- 单击右上角“新建知识库”,进入新建知识库页面。
- 在“新建知识库”页面设置知识库信息。
在“模型设置”页签,设置“NLP模型服务”,选择上一步新建的模型服务。
其他参数可以保持默认值或基于业务场景配置。
- 设置好后,单击“确定”完成知识库创建。
- 在知识库列表,选择新建知识库,单击操作列的“文档管理”。进入知识库详情页面。
- 选择“文档管理”页签,单击“上传”。在上传对话框中单击“选择文档”,本地选择已提前准备好的文档。重复的文档不允许上传。
图4 上传文档
- 单击“确认”。文档上传后,可在文档管理页签查看已上传的文档,当“文档状态”为“正常”,说明文档已上传成功。
- 选择知识库。
- 在KooSearch控制台,左侧导航栏选择“体验平台”,进入体验平台页面。
- 单击右上角
,在“资料来源”对话框勾选新建的知识库,单击“确定”。
- 体验问答。
KooSearch同时支持由大模型自身知识回答和通过文章内容回答。
- 在“体验平台”页面右上角单击“问答”,切换至问答体验页面。
- 在输入框中输入问题,单击
,查看返回的答案。
图5 体验问答