文档首页/ 智能体开发平台 AgentArts/ API参考/ API/ 评估/ 评测集管理/ 批量添加评测集条目 - BatchCreateOpsDatasetItems
更新时间:2026-04-15 GMT+08:00
分享

批量添加评测集条目 - BatchCreateOpsDatasetItems

功能介绍

该接口用于向指定评测集的草稿态批量注入数据行,支持增量添加、覆盖更新或基于历史版本还原数据,并强制校验数据与Schema的符合性。

适用场景:

  • 数据初始化:在创建评测集后,通过API批量导入首批业务数据或基准测试集。

  • 版本回滚:当前草稿数据出现异常时,通过指定源版本ID将评测集内容恢复至特定历史快照。

URI

POST /v1/ops/datasets/{dataset_id}/items

表1 路径参数

参数

是否必选

参数类型

描述

dataset_id

String

参数解释:

评测集的ID。

约束限制:

由英文、数字、“-”、“_”组成,长度为1到64个字符。

取值范围:

1-64位字符。

默认取值:

不涉及。

表2 Query参数

参数

是否必选

参数类型

描述

source_version_id

String

参数解释:

源版本ID。在执行版本还原或基于特定版本批量添加数据的场景下,指定作为数据来源的历史版本标识。

约束限制:

长度为0到100个字符。

取值范围:

有效的版本ID字符串。

默认取值:

不涉及。

overwrite

Boolean

参数解释:

覆盖模式开关。用于控制在批量添加新条目之前,是否清空目标评测集(通常为草稿版)中的现有数据。

约束限制:

不涉及。

取值范围:

  • true: 覆盖模式,先清空后添加。

  • false: 追加模式,在现有数据基础上新增。

默认取值:

false。

请求参数

表3 请求Header参数

参数

是否必选

参数类型

描述

Content-Type

String

参数解释:

消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

application/json

Authorization

String

参数解释:

签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

X-Sdk-Date

String

参数解释:

请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

表4 请求Body参数

参数

是否必选

参数类型

描述

items

Array of OpsAddItemRequest objects

参数解释:

待添加到评测集中的数据条目列表。

约束限制:

必填参数;数组长度限制为1到1000个条目。

取值范围:

符合OpsAddItemRequest结构的对象数组。

默认取值:

不涉及。

表5 OpsAddItemRequest

参数

是否必选

参数类型

描述

turns

Array of OpsTurnInput objects

参数解释:

构成该数据条目的交互轮次列表。对于单轮问答长度为1,多轮对话包含多个轮次。

约束限制:

包含1到10000个轮次项。

取值范围:

参考OpsTurnInput定义。

默认取值:

不涉及。

表6 OpsTurnInput

参数

是否必选

参数类型

描述

fields

Array of OpsFieldValueInput objects

参数解释:

当前轮次中包含的具体数据字段(如Input、Output、Rationale 等)集合。

约束限制:

包含0到10000个字段项。

取值范围:

参考OpsFieldValueInput定义。

默认取值:

不涉及。

表7 OpsFieldValueInput

参数

是否必选

参数类型

描述

key

String

参数解释:

字段的键名,需与评测集Schema中定义的字段名保持一致。

约束限制:

0到100。

取值范围:

符合Schema定义的Key字符串。

默认取值:

不涉及。

type

String

参数解释:

字段的数据存储类型,决定系统底层解析逻辑。

约束限制:

长度 0到10000字符。

取值范围:

常见值如 string, integer, float, boolean, object 等。

默认取值:

不涉及。

content_type

String

参数解释:

字段的内容表现形式,用于前端渲染或后端逻辑识别。

约束限制:

长度 0到10000字符。

取值范围:

常见值如 text, markdown, image_url, file_path 等。

默认取值:

text。

value

String

参数解释:

字段承载的实际业务数据值。

约束限制:

长度 0到10000字符。

取值范围:

根据type定义,需符合对应的解析要求。

默认取值:

不涉及。

响应参数

状态码:200

表8 响应Body参数

参数

参数类型

描述

item_ids

Array of strings

参数解释:

系统为新创建的数据条目生成的唯一标识符列表。

取值范围:

符合数据库标识符规范的字符串列表。

请求示例

向评测集批量添加评测数据条目。此示例采用追加模式(overwrite=false),并根据Schema定义上传了两条数据。

POST https://*.com/agentarts/v1/ops/datasets/ds_7590068991923321856/items?overwrite=false

{
  "items" : [ {
    "turns" : [ {
      "fields" : [ {
        "key" : "question",
        "type" : "string",
        "content_type" : "text",
        "value" : "如何更换汽车机油?"
      }, {
        "key" : "expected_answer",
        "type" : "string",
        "content_type" : "text",
        "value" : "1. 准备工具;2. 排出旧油;3. 更换滤清器;4. 加入新油。"
      } ]
    } ]
  }, {
    "turns" : [ {
      "fields" : [ {
        "key" : "question",
        "type" : "string",
        "content_type" : "text",
        "value" : "北京的天气怎么样?"
      }, {
        "key" : "expected_answer",
        "type" : "string",
        "content_type" : "text",
        "value" : "北京今日晴,气温 15°C 到 22°C。"
      } ]
    } ]
  } ]
}

响应示例

状态码:200

添加成功

{
  "item_ids" : [ "550e8400-e29b-41d4-a716-446655440021", "550e8400-e29b-41d4-a716-446655440022" ]
}

状态码

状态码

描述

200

添加成功

错误码

请参见错误码

相关文档