创建知识数据集
功能介绍
该接口用于创建知识数据集,可将原始文档按照一定规则进行处理,用于后续生成知识库。
调用方法
请参见如何调用API。
URI
POST https://aiae.appstage.myhuaweicloud.com/v1/knowledge-datasets
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
data_set |
是 |
String |
参数解释: 创建知识数据集请求体,参数结构请参见“附录 > 知识数据集请求参数说明”。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 |
file |
否 |
Array of strings |
参数解释: 上传的文件。 取值范围: 数量不超过10个。 默认取值: 不涉及。 约束限制:
|
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
Authorization |
是 |
String |
参数解释: 鉴权信息。获取平台API Key,并为API Key添加前缀Bearer,得到标准鉴权信息,例如Bearer sk-74e4157***。API Key获取方法请参见创建API Key。 约束限制: 不涉及。 取值范围: 不涉及。 默认取值: 不涉及。 |
响应参数
状态码:200
参数 |
参数类型 |
描述 |
---|---|---|
data |
String |
参数解释: 正常返回的结果。 取值范围: 不涉及。 |
状态码:400
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
参数解释: 异常错误码。 取值范围: 不涉及。 |
error_msg |
String |
参数解释: 异常错误信息。 取值范围: 不涉及。 |
请求示例
{ "name" : "测试", "description" : "测试", "data_type" : "TEXT", "tags" : [ "对话问答", "文案生成" ], "ingestion_config" : { "data_source" : "FILE_UPLOAD", "file_types" : [ "txt" ] }, "schedule_config" : { "schedule_type" : "ONCE" }, "preprocess_config" : { "cleaning_methods" : [ "invisible" ], "pdf_preprocess_type" : "NO_PREPROCESS" }, "chunk_config" : { "slicing_configs" : { "txt" : { "slicing_method" : "autoSlicing" } } }, "extraction_config" : { "extraction_example" : "今天天气如何?答:还不错哦。", "extraction_mode" : "RULE_EXTRACTION", "rule_extraction_configs" : [ { "extraction_rule" : "SEPARATOR", "field_name" : "question", "separator_extraction" : { "contain_separator" : false, "extraction_code" : 1, "separator" : "?" } }, { "extraction_rule" : "TEMPLATE", "field_name" : "answer", "template_extraction" : { "contain_end" : true, "contain_start" : false, "end_with" : "。", "extraction_code" : 1, "start_with" : "答" } } ] }, "index_config" : { "description" : "索引配置", "long_text_solution" : "TRUNCATE_MODE", "name" : "索引配置", "rag_type" : "VECTOR_RAG", "retrieval_configs" : [ { "category" : "FULL_CHUNK", "name" : "chunk", "retrieval_return" : false, "text_filter" : false, "vector_retrieval" : false }, { "category" : "CHUNK_FRAGMENT", "name" : "question", "retrieval_return" : true, "text_filter" : true, "vector_retrieval" : true }, { "category" : "CHUNK_FRAGMENT", "name" : "answer", "retrieval_return" : true, "text_filter" : true, "vector_retrieval" : false } ], "vector_model_service_key" : "GPT-4" } }
响应示例
状态码:200
操作成功,返回数据集id。
{ "data" : "3f28e62-xxxxxxxx-a15be0d638a2" }
状态码:400
请求错误。
{ "error_code" : "AIAE.40001001", "error_msg" : "参数xxxx不合法。" }
状态码
状态码 |
描述 |
---|---|
200 |
操作成功,返回数据集id。 |
400 |
请求错误。 |
错误码
请参见错误码。