文档首页/ 智果（AgentArts）智能体平台/ API参考/ API/ 评估/ 评测集管理/ 创建评测集合成任务 - CreateOpsSynthesisTask

更新时间：2026-07-21 GMT+08:00

创建评测集合成任务 - CreateOpsSynthesisTask

功能介绍

该接口用于利用大模型能力发起异步的数据合成任务，通过种子数据泛化（Seed-based Generalization）等手段自动生成高质量、多样化的训练或评测样本。

适用场景：

数据样本扩充：在现有数据量不足时，基于少量种子数据生成大规模同分布的模拟数据，提升模型训练效果。
边界场景覆盖：通过 AI 模拟生成罕见或特定领域的对话记录，增强评测集对极端情况（Edge Cases）的覆盖度。

调用方法

请参见如何调用API。

授权信息

账号根用户具备所有API的调用权限，如果使用账号下的IAM用户调用当前API，该IAM用户需具备如下身份策略权限，更多的权限说明请参见权限和授权项。

授权项	访问级别	资源类型（*为必须）	条件键	别名	依赖的授权项
agentarts:dataset:createOpsSynthesisTask	Write	dataset *	g:ResourceTag/<tag-key>	-	-

URI

POST /v1/ops/datasets-synthesis

请求参数

表1 请求Body参数
参数	是否必选	参数类型	描述
name	是	String	参数解释：数据合成任务的显示名称，用于在任务列表中进行识别与检索。约束限制：长度为2-100个字符。取值范围：任意字符串。默认取值：不涉及。
scenario_type	是	String	参数解释：指定数据合成的具体逻辑场景。约束限制：必填，仅支持枚举值。字符长度1-100。取值范围：字符长度1-100，seed_data (基于种子数据生成)。默认取值：不涉及。
scenario_description	否	String	参数解释：对合成任务背景的详细描述，辅助模型更好地理解合成目标。约束限制： 1-4000个字符。取值范围：字符长度1-4000，由用户定义的业务背景描述。默认取值：不涉及。
status	否	String	参数解释：任务创建后的初始执行状态。约束限制：字符长度1-100，枚举类型。取值范围：字符长度1-100，pending(仅保存草稿)，running(立即启动运行)。默认取值： pending。
model_config	是	OpsEvaluationModelConfig object	参数解释：执行合成任务所调用的底层大模型配置信息。约束限制：必填，参考OpsEvaluationModelConfig定义。取值范围：不涉及。默认取值：不涉及。
seed_data	否	OpsEvaluationSeedDataCreateConfig object	参数解释：作为合成基础的源数据配置。约束限制：当 scenario_type 为 seed_data 时必填。取值范围：参考EvaluationOpsSeedDataCreateConfig定义。默认取值：不涉及。
schemas	是	Array of OpsEvaluationSynthesisSchema objects	参数解释：定义合成数据输出的字段结构与约束。约束限制：数组长度为 1-50。取值范围：参考OpsEvaluationSynthesisSchema定义。默认取值：不涉及。
sample_count	是	Integer	参数解释：期望通过本次合成任务产出的目标样本总数。约束限制： 1-500之间的整数。取值范围： 1-500。默认取值：不涉及。

表2 OpsEvaluationModelConfig
参数	是否必选	参数类型	描述
model_id	是	String	参数解释：指定调用的大模型唯一标识符，通过模型列表接口获取。
model_name	是	String	参数解释：模型的显示名称。取值范围：任意字符串。
temperature	否	Float	参数解释：采样温度参数，用于控制输出的随机性。数值低更聚焦，数值高更具创造性。取值范围： 0.0到2.0。
max_tokens	否	Integer	参数解释：单次推理生成的最大Token数量限制。取值范围： 1-32000。
top_p	否	Float	参数解释：核采样参数。取值范围： 0.0到1.0。
frequency_penalty	否	Float	参数解释：频率惩罚系数，降低内容重复倾向。取值范围： -2.0到2.0。

表3 OpsEvaluationSeedDataCreateConfig
参数	是否必选	参数类型	描述
type	否	String	参数解释：指定种子数据的来源类型。约束限制：枚举值。取值范围：字符长度1-100，dataset(平台评测集),file(本地上传文件)。默认取值：不涉及。
dataset_id	否	String	参数解释：种子评测集的唯一标识符，通过数据集列表接口获取。约束限制： 0-64个字符；当type为dataset时必填。取值范围：字符长度0-64，已存在的评测集ID。默认取值：不涉及。
dataset_version_id	否	String	参数解释：指定种子评测集的具体版本标识。约束限制： 0-64个字符。取值范围：已发布或草稿版本的ID。默认取值：指向草稿版本。
file_name	否	String	参数解释：上传的种子数据文件的原始名称。约束限制： 1-200个字符，当type为file时必填。取值范围： 1-200个字符，合法的文件名。默认取值：不涉及。
obs_tmp_file_id	否	String	参数解释：种子数据文件在OBS中的临时存储路径。约束限制：最大长度10000字符。取值范围： OBS路径字符串。默认取值：不涉及。

表4 OpsEvaluationSynthesisSchema
参数	是否必选	参数类型	描述
id	否	String	参数解释：合成字段的id。取值范围：由字母、数字、下划线组成。
name	是	String	参数解释：合成字段的名称。取值范围：长度1-100字符，由字母、数字、下划线组成。
description	否	String	参数解释：合成字段的业务含义描述。取值范围：任意字符串。
synthesis_requirement	否	String	参数解释：合成要求，用于指导LLM生成该字段的思考路径。取值范围： 0-4000字符，详细的指令说明。

响应参数

状态码：200

表5 响应Body参数
参数	参数类型	描述
id	String	参数解释：系统生成的合成任务唯一标识符。取值范围：符合通用唯一识别码(UUID)标准的字符串。

请求示例

任务创建

POST https://api.example.com/v1/ops/datasets-synthesis

{
  "name" : "从现有数据演化生成技术面试题",
  "scenario_type" : "seed_data",
  "scenario_description" : "基于现有100条React问答，生成50条更复杂的面试题",
  "status" : "pending",
  "model_config" : {
    "model_id" : "1749615103",
    "model_name" : "豆包·1.6·自动深度思考",
    "temperature" : 0.1,
    "max_tokens" : 4096,
    "top_p" : 0.7,
    "frequency_penalty" : 0
  },
  "seed_data" : {
    "type" : "dataset",
    "dataset_id" : "c3c2571d-a8b0-4447-8b79-a67cac076768",
    "dataset_version_id" : "c3c2571d-a8b0-4447-8b79-a67cac076768",
    "file_name" : "seed.jsonl",
    "obs_tmp_file_id" : "obs:../path/to/seed.jsonl"
  },
  "schemas" : [ {
    "name" : "input",
    "description" : "作为输入投递给评测对象",
    "synthesis_requirement" : "生成技术深度适中、具有实践意义的React问题，考虑候选人2-3年经验水平"
  } ],
  "sample_count" : 50
}

响应示例

状态码：200

任务创建成功

{
  "id" : "task_uuid"
}

状态码

状态码	描述
200	任务创建成功

错误码

请参见错误码。

父主题： 评测集管理

上一篇：查询评测集合成任务列表 - ListOpsSynthesisTasks

下一篇：查询评测集合成任务详情 - ShowOpsSynthesisTask

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问