查询智能体优化任务列表

功能介绍

本接口用于查询当前租户下的智能体优化任务列表，支持通过任务名称和任务状态进行过滤，并支持分页功能。同时，响应中会返回全局状态的分组统计信息。

适用场景：

分页浏览所有优化任务，快速定位特定名称的任务以查看详情。
根据任务状态（如训练中、成功、失败）筛选任务，批量监控或处理处于同一阶段的任务。

URI

GET /v1/ops/model-tuning-tasks

表1 Query参数
参数	是否必选	参数类型	描述
offset	否	Integer	参数解释：索引位置偏移量，用于指定从第几条记录开始返回，单位：条（记录数）。约束限制：不涉及取值范围：大于等于0的整数。默认取值： 0
limit	否	Integer	参数解释：查询记录数，表示单页返回的最大任务数，单位：条。约束限制：不涉及取值范围： 1到100的正整数。默认取值：无
name	否	String	参数解释：任务名称，用于根据名称关键词筛选任务。约束限制：支持包含匹配的模糊搜索。取值范围：长度1-64个字符。默认取值：无
status	否	String	参数解释：任务状态，用于根据状态筛选任务。约束限制：不涉及取值范围： draft草稿态，training训练中，stopped已停止，success成功，fail失败。默认取值：无

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
Content-Type	是	String	参数解释：消息体编码格式。用于告知服务端请求体（Body）所采用的主体数据类型，以便服务端正确解析。约束限制：不涉及取值范围： application/json 默认取值： application/json
Authorization	是	String	参数解释：签名认证信息，当使用AK/SK方式认证时，使用SDK对请求进行签名的过程中会自动填充该字段。约束限制：不涉及取值范围：不涉及默认取值：不涉及
X-Sdk-Date	是	String	参数解释：请求发送的时间，当使用AK/SK方式认证时，使用SDK对请求进行签名的过程中会自动填充该字段。约束限制：不涉及取值范围：不涉及默认取值：不涉及

响应参数

状态码：200

表3 响应Body参数
参数	参数类型	描述
total	Integer	参数解释：满足过滤条件的记录总数，用于计算分页总页数。取值范围： 0-100的整数。
status_count	TuningTaskStatusCount object	参数解释：状态分组数，表示当前租户下所有任务的状态分布（不受分页参数影响）。取值范围：符合TuningTaskStatusCount定义的对象。
tasks	Array of OpsModelTuningTask objects	参数解释：任务列表，表示当前分页下的任务详情列表。取值范围：符合OpsModelTuningTask 定义的对象数组。

表4 TuningTaskStatusCount
参数	参数类型	描述
draft	Integer	参数解释：草稿任务个数。取值范围： 0-1000的整数。
training	Integer	参数解释：训练中任务个数。取值范围： 0-1000的整数。
stopping	Integer	参数解释：停止中任务个数。取值范围： 0-1000的整数。
stopped	Integer	参数解释：已停止任务个数。取值范围： 0-1000的整数。
success	Integer	参数解释：成功任务个数。取值范围： 0-1000的整数。
fail	Integer	参数解释：失败任务个数。取值范围： 0-1000的整数。
deleting	Integer	参数解释：删除中任务个数。取值范围： 0-1000的整数。

表5 OpsModelTuningTask
参数	参数类型	描述
id	String	参数解释：智能体优化任务ID。取值范围： UUID格式字符串。
name	String	参数解释：任务名称。取值范围：长度1-64个字符的字符串。
description	String	参数解释：任务描述。取值范围：长度0-255个字符的字符串。
agent	OpsTuningTargetAgent object	参数解释：调优目标对象，包含目标智能体的配置信息。取值范围：符合OpsTuningTargetAgent定义的对象。
model_name	String	参数解释：调优模型名称。取值范围： qwen3_8b或qwen3_1_7b。
train_agent	OpsTuningTrainAgent object	参数解释：训练实例对象，包含训练过程中实际使用的模型实例信息。取值范围：符合OpsTuningTrainAgent定义的对象。
training_type	String	参数解释：训练类型。取值范围：固定值为rl（强化学习）。
tuning_method	String	参数解释：调优方法。取值范围：固定值为grpo（群组相对策略优化）。
reward_setting	OpsTuningRewardSetting object	参数解释：奖励函数配置详情。取值范围：符合OpsTuningRewardSetting定义的对象。
parameter_setting	OpsTuningParamSetting object	参数解释：超参数设置详情。取值范围：符合OpsTuningParamSetting定义的对象。
dataset	OpsDatasetInfo object	参数解释：数据集配置详情。取值范围：符合OpsDatasetInfo定义的对象。
validation_set_ratio	Integer	参数解释：验证集比例。取值范围： 0到100的整数。
train_product_path	String	参数解释：训练产物路径。取值范围：不涉及
agency_name	String	参数解释：委托名称，赋予服务访问用户资源的权限。取值范围：有效的IAM委托名称字符串。
status	String	参数解释：任务状态。取值范围： draft草稿态，training训练中，stopped已停止，success成功，fail失败，deleting删除中，stopping停止中。
fail_detail	OpsFailDetail object	参数解释：失败详情信息，包含错误码和错误详情。取值范围：符合OpsFailDetail定义的对象。
progress	Double	参数解释：任务进度，单位：%。取值范围： 0.0到100.0之间的浮点数。
created_at	Long	参数解释：创建时间，单位：毫秒（13位时间戳）。取值范围： 13位毫秒级时间戳。
updated_at	Long	参数解释：更新时间，单位：毫秒（13位时间戳）。取值范围： 13位毫秒级时间戳。
executed_time	Integer	参数解释：运行时长，单位：分钟。取值范围：大于等于0的整数。
tags	Array of OpsTasksTagForTMS objects	参数解释：资源标签列表。取值范围：符合OpsTasksTagForTMS定义的对象数组。

表6 OpsTuningTargetAgent
参数	参数类型	描述
type	String	参数解释：智能体类型。取值范围：单智能体agent，工作流workflow。
id	String	参数解释：智能体ID。取值范围：必须是系统中存在的真实ID。
version	String	参数解释：智能体版本。取值范围：版本号字符串，默认为latest。
node_type	String	参数解释：工作流节点类型。仅当type为workflow时生效。取值范围：意图识别intent_detection，大模型llm。
node_id	String	参数解释：工作流节点ID。仅当type为workflow时生效。取值范围：有效节点标识符字符串。

表7 OpsTuningTrainAgent
参数	参数类型	描述
id	String	参数解释：智能体ID，训练实例关联的智能体。取值范围：有效标识符字符串。
version	String	参数解释：智能体版本。取值范围：版本号字符串。
model_provider_id	String	参数解释：训练模型的供应商ID，标识模型来源的服务商。取值范围：供应商标识字符串。
model_id	String	参数解释：训练模型ID，标识正在被训练的具体模型实例。取值范围：模型标识字符串。

表8 OpsTuningRewardSetting
参数	参数类型	描述
reward_type	String	参数解释：奖励类型。取值范围： rule（规则奖励），generative（生成式奖励）。
model_name	String	参数解释：模型名称，用于生成式奖励打分的裁判模型取值范围：支持的判别模型名称字符串。
apikey_credential_provider	String	参数解释： API密钥凭证提供者，用于访问判别模型的认证信息。取值范围：系统中配置的凭证名称。
rubric	String	参数解释：评分标准，指导判别模型进行评分的提示词内容。取值范围：长度0-4096个字符的提示词。
rules	Array of OpsTuningRewardRule objects	参数解释：规则列表，定义具体的正则匹配规则。取值范围：数组长度1-10。

表9 OpsTuningRewardRule
参数	参数类型	描述
function_name	String	参数解释：规则名称。取值范围：思维链式奖励think_format_reward，精准匹配奖励exact_match_reward，数值匹配奖励math_correctness_reward。
weight	Double	参数解释：权重。取值范围： 0.0到1.0之间的浮点数。
regex	String	参数解释：正则表达式。取值范围：合法的正则表达式字符串。

**表10** OpsTuningParamSetting
参数	参数类型	描述
actor_optimizer_lr	String	参数解释：优化器学习率，控制模型参数更新的步长。取值范围：科学计数法字符串，如1.0E-5。
train_batch_size	Integer	参数解释：批大小，单次训练迭代中使用的样本数量。取值范围：正整数。
rollout_num	Integer	参数解释：分组大小，GRPO算法中每次生成用于对比的样本组数量。取值范围：正整数。
epoch_num	Integer	参数解释：训练轮数，全量数据集被模型训练的次数。取值范围： 1到1000的正整数。
max_length	Integer	参数解释：最大长度，模型生成序列的最大Token数。取值范围： 1到100000的正整数。
ckpt_save_step	Integer	参数解释： step保存频率，每隔多少个训练步保存一次模型检查点。取值范围： 1到10000正整数。

**表11** OpsDatasetInfo
参数	参数类型	描述
id	String	参数解释：数据集ID。取值范围：真实存在的数据集ID字符串。
version	String	参数解释：数据集版本号。取值范围：版本号字符串。
version_name	String	参数解释：版本名称。取值范围：版本显示名称字符串。

**表12** OpsFailDetail
参数	参数类型	描述
error_code	String	参数解释：错误码。取值范围：规范化的系统错误码字符串。
error_msg	String	参数解释：错误信息。取值范围：错误描述字符串。

**表13** OpsTasksTagForTMS
参数	参数类型	描述
key	String	参数解释：标签键。取值范围：不能为空或者空字符串，不能为空格，校验和使用之前先trim前后半角空格，最大长度128个unicode字符。
value	String	参数解释：值。取值范围：不校验字符集范围。每个值最大长度255个unicode字符。

状态码：400

**表14** 响应Body参数
参数	参数类型	描述
error_code	String	参数解释：机器可读的错误代码。取值范围：系统错误码字符串。
error_msg	String	参数解释：人类可读的错误消息。取值范围：详细错误说明字符串。

状态码：500

**表15** 响应Body参数
参数	参数类型	描述
error_code	String	参数解释：机器可读的错误代码。取值范围：系统错误码字符串。
error_msg	String	参数解释：人类可读的错误消息。取值范围：详细错误说明字符串。

请求示例

查询当前租户下的模型优化任务列表，支持通过任务名称和任务状态进行过滤，并支持分页功能。

 GET https://*.com/v1/ops/model-tuning-tasks?offset=0&limit=10&name=test&status=training

Content-Type:application/json
X-Sdk-Date:20240416T095341Z
Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************

响应示例

状态码：200

{
  "total" : 2,
  "status_count" : {
    "draft" : 1,
    "training" : 1,
    "stopping" : 0,
    "stopped" : 2,
    "success" : 5,
    "fail" : 1,
    "deleting" : 0
  },
  "tasks" : [ {
    "id" : "57ae91cf2f504899921a50d1c75f0547",
    "name" : "test-tuning-task-01",
    "description" : "这是一个测试模型优化任务",
    "agent" : {
      "type" : "agent",
      "id" : "f0fab58d-8285-4c47-b856-1079cad579da",
      "version" : null,
      "node_type" : "intent_detection",
      "node_id" : "node_1773821451705"
    },
    "model_name" : "qwen3_8b",
    "train_agent" : {
      "id" : "train-agent-001",
      "version" : "1.0.0",
      "model_provider_id" : "provider-001",
      "model_id" : "model-001"
    },
    "training_type" : "rl",
    "tuning_method" : "grpo",
    "reward_setting" : {
      "reward_type" : "rule",
      "model_name" : null,
      "apikey_credential_provider" : null,
      "rubric" : null,
      "rules" : [ {
        "function_name" : "exact_match_reward",
        "weight" : 0.6,
        "regex" : "^[\\s\\S]*$"
      }, {
        "function_name" : "think_format_reward",
        "weight" : 0.4,
        "regex" : "<think>[\\s\\S]*</think>"
      } ]
    },
    "parameter_setting" : {
      "actor_optimizer_lr" : "1.0E-5",
      "train_batch_size" : 8,
      "rollout_num" : 4,
      "epoch_num" : 3,
      "max_length" : 4096,
      "ckpt_save_step" : 100
    },
    "dataset" : {
      "id" : "b1ba4480-ad2d-4af6-8bae-af392b4eef83",
      "version" : "dd31db39-3973-4eff-b0e7-01a29454635b",
      "version_name" : "v1.0.0"
    },
    "validation_set_ratio" : 10,
    "train_product_path" : "obs://bucket-name/tuning/output/a1b2c3d4/",
    "agency_name" : "ops-tuning-agency",
    "status" : "training",
    "fail_detail" : null,
    "progress" : 35.5,
    "created_at" : 1744214400000,
    "updated_at" : 1744218000000,
    "executed_time" : 60,
    "tags" : [ {
      "key" : "project",
      "value" : "ops-demo"
    } ]
  } ]
}

状态码

状态码	描述
200	参数解释：任务列表数据。取值范围：无
400	参数解释：无效的请求参数。取值范围：无
500	参数解释：内部服务器错误。取值范围：无

描述

200

参数解释：任务列表数据。

取值范围：无

400

参数解释：无效的请求参数。

取值范围：无

500

参数解释：内部服务器错误。

取值范围：无