更新时间:2024-11-11 GMT+08:00
分享

检索知识库数据

功能介绍

检索知识库数据,根据用户提供的检索信息,返回命中的信息数据。

URI

POST https://aiae.appstage.myhuaweicloud.com/v1/knowledge-bases/{knowledge_base_id}/embed-datas

表1 路径参数

参数

是否必选

参数类型

描述

knowledge_base_id

String

知识库id。

请求参数

表2 请求Body参数

参数

是否必选

参数类型

描述

keyword

String

搜索关键字。

similarity_min

Float

相似度最小值。

limit

Integer

检索返回切片限制数量。

filter

SearchSqlFilter object

过滤条件。

order_by

SqlOrder object

排序规则。

data_sets

Array of DataSetSearchInfo objects

检索的知识数据集信息,用于检索知识库中部分数据集。

表3 SearchSqlFilter

参数

是否必选

参数类型

描述

group_type

String

过滤条件运算符。

expressions

Array of Expression objects

过滤条件。

表4 Expression

参数

是否必选

参数类型

描述

field

String

过滤字段。

field_type

String

过滤字段类型。

operator

String

过滤操作符。

values

Array of strings

过滤值。

表5 SqlOrder

参数

是否必选

参数类型

描述

order_items

Array of OrderItem objects

排序规则。

表6 OrderItem

参数

是否必选

参数类型

描述

field

String

排序字段。

field_type

String

排序字段类型。

order_type

String

排序类型。

表7 DataSetSearchInfo

参数

是否必选

参数类型

描述

data_set_id

String

知识数据集id。

响应参数

状态码: 200

表8 响应Body参数

参数

参数类型

描述

data

Array of ChunkData objects

检索知识库数据具体内容。

表9 ChunkData

参数

参数类型

描述

id

String

切片id。

document

String

切片向量化内容。

chunk

String

完整切片内容。

chunk_fragments

Map<String,String>

切片片段(map类型,key为切片片段名称,value为切片片段内容)。

similarity

Float

向量化内容(document)和检索关键字(keyword)的向量相似度。

metadata

metadata object

文本过滤字段。

download_addresses

Map<String,String>

图片或视频临时下载地址(map类型,key为文件路径,value为下载地址)。

download_address

String

废弃字段,请使用download_addresses。

data_set_id

String

切片所属知识数据集id。

表10 metadata

参数

参数类型

描述

order

Integer

切片序号。

file_name

String

文件名称。

path

String

文件路径。

状态码: 500

表11 响应Body参数

参数

参数类型

描述

error_code

String

异常错误码。

error_msg

String

异常错误信息。

请求示例

{
  "keyword" : "户外",
  "similarity_min" : "0.78",
  "limit" : 10,
  "filter" : null,
  "order_by" : null,
  "data_sets" : [ null ]
}

响应示例

状态码: 200

OK。

{
  "data": [
    {
      "id": "812857ef-e298-4b8e-8bd1-24ba9fd5e95c",
      "document": "问题:你是谁。",
      "chunk": "问题:你是谁。回答:我是xxx。回答用户id:000",
      "chunk_fragments": {
      "answer": "我是xxx。"
      },
      "similarity": 0.87,
      "metadata": {
      "order": 0,
      "file_name": "户外运动热度大大带动各相关产业发展.docx",
      "path": "户外/户外运动/热度大大带动各相关产业发展.docx"
      },
      "download_addresses": {
      "xxx.png": "https://xxxx"
      },
      "download_address": null,
      "data_set_id": "3967c49d-63b2-4957-a2ec-5eda056a1f1b",
    }
  ]
}

状态码: 500

服务器内部错误或三方服务器内部错误。

{
  "error_code" : "AIAE.00001500",
  "error_msg" : "系统内部错误。"
}

状态码

状态码

描述

200

OK。

500

服务器内部错误或三方服务器内部错误。

错误码

请参见错误码

相关文档