查询智能体优化任务详情

功能介绍

本接口根据唯一ID获取单个智能体优化任务的全量元数据，涵盖目标智能体配置、详尽的超参数设定、数据集绑定及实时运行状态。

适用场景：

展示特定任务的完整配置信息，供用户核对或复盘。
实时监控任务的运行状态与进度，获取训练失败时的错误详情，获取已成功任务的训练产物路径及模型版本信息。

URI

GET /v1/ops/model-tuning-tasks/{task_id}

表1 路径参数
参数	是否必选	参数类型	描述
task_id	是	String	参数解释：智能体优化任务ID，标识任务的唯一标识符。获取方法请参考查询智能体优化任务列表。约束限制：不涉及取值范围： 32位ID字符串。默认取值：无

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
Content-Type	是	String	参数解释：消息体编码格式。用于告知服务端请求体（Body）所采用的主体数据类型，以便服务端正确解析。约束限制：不涉及取值范围： application/json 默认取值： application/json
Authorization	是	String	参数解释：签名认证信息，当使用AK/SK方式认证时，使用SDK对请求进行签名的过程中会自动填充该字段。约束限制：不涉及取值范围：不涉及默认取值：不涉及
X-Sdk-Date	是	String	参数解释：请求发送的时间，当使用AK/SK方式认证时，使用SDK对请求进行签名的过程中会自动填充该字段。约束限制：不涉及取值范围：不涉及默认取值：不涉及

响应参数

状态码：200

表3 响应Body参数
参数	参数类型	描述
id	String	参数解释：智能体优化任务ID。取值范围： UUID格式字符串。
name	String	参数解释：任务名称。取值范围：长度1-64个字符的字符串。
description	String	参数解释：任务描述。取值范围：长度0-255个字符的字符串。
agent	OpsTuningTargetAgent object	参数解释：调优目标对象，指定本次优化任务针对的目标智能体或工作流。取值范围：符合OpsTuningTargetAgent定义的对象。
model_name	String	参数解释：调优模型名称。取值范围： qwen3_8b或qwen3_1_7b。
train_agent	OpsTuningTrainAgent object	参数解释：训练实例对象，包含训练过程中实际使用的模型实例信息。取值范围：符合OpsTuningTrainAgent定义的对象。
training_type	String	参数解释：训练类型。取值范围：固定值为rl（强化学习）。
tuning_method	String	参数解释：调优方法。取值范围：固定值为grpo（群组相对策略优化）。
reward_setting	OpsTuningRewardSetting object	参数解释：奖励函数配置详情。取值范围：符合OpsTuningRewardSetting定义的对象。
parameter_setting	OpsTuningParamSetting object	参数解释：超参数设置详情。取值范围：符合OpsTuningParamSetting定义的对象。
dataset	OpsDatasetInfo object	参数解释：数据集配置详情。取值范围：符合OpsDatasetInfo定义的对象。
validation_set_ratio	Integer	参数解释：验证集比例，单位：%。取值范围： 0到100的整数。
train_product_path	String	参数解释：训练产物路径。取值范围：不涉及
agency_name	String	参数解释：委托名称，赋予服务访问用户资源的权限。取值范围：有效的IAM委托名称字符串。
status	String	参数解释：任务状态。取值范围： draft草稿态，training训练中，stopped已停止，success成功，fail失败，deleting删除中，stopping停止中。
fail_detail	OpsFailDetail object	参数解释：失败详情信息，包含错误码和错误详情。取值范围：符合OpsFailDetail定义的对象。
progress	Double	参数解释：任务进度，单位：%。取值范围： 0.0到100.0之间的浮点数。
created_at	Long	参数解释：创建时间，单位：毫秒（13位时间戳）。取值范围： 13位毫秒级时间戳。
updated_at	Long	参数解释：更新时间，单位：毫秒（13位时间戳）。取值范围： 13位毫秒级时间戳。
executed_time	Integer	参数解释：运行时长，单位：分钟。取值范围：大于等于0的整数。
tags	Array of OpsTasksTagForTMS objects	参数解释：资源标签列表。取值范围：符合OpsTasksTagForTMS定义的对象数组。

表4 OpsTuningTargetAgent
参数	参数类型	描述
type	String	参数解释：智能体类型。取值范围：单智能体agent，工作流workflow。
id	String	参数解释：智能体ID。取值范围：必须是系统中存在的真实ID。
version	String	参数解释：智能体版本。取值范围：版本号字符串，默认为latest。
node_type	String	参数解释：工作流节点类型。仅当type为workflow时生效。取值范围：意图识别节点intent_detection，大模型节点llm。
node_id	String	参数解释：工作流节点ID。仅当type为workflow时生效。取值范围：有效节点标识符字符串。

表5 OpsTuningTrainAgent
参数	参数类型	描述
id	String	参数解释：智能体ID，训练实例关联的智能体。取值范围：有效标识符字符串。
version	String	参数解释：智能体版本。取值范围：版本号字符串。
model_provider_id	String	参数解释：训练模型的供应商ID，标识模型来源的服务商。取值范围：供应商标识字符串。
model_id	String	参数解释：训练模型ID，标识正在被训练的具体模型实例。取值范围：模型标识字符串。

表6 OpsTuningRewardSetting
参数	参数类型	描述
reward_type	String	参数解释：奖励类型。取值范围： rule（规则奖励），generative（生成式奖励）。
model_name	String	参数解释：模型名称，用于生成式奖励打分的裁判模型。取值范围：支持的判别模型名称字符串。
apikey_credential_provider	String	参数解释： API密钥凭证提供者，用于访问判别模型的认证信息。取值范围：系统中配置的凭证名称。
rubric	String	参数解释：评分标准，指导判别模型进行评分的提示词内容。取值范围：长度0-4096个字符的提示词。
rules	Array of OpsTuningRewardRule objects	参数解释：规则列表，定义具体的正则匹配规则。取值范围：数组长度1-10。

表7 OpsTuningRewardRule
参数	参数类型	描述
function_name	String	参数解释：规则名称。取值范围：思维链式奖励think_format_reward，精准匹配奖励exact_match_reward，数值匹配奖励math_correctness_reward。
weight	Double	参数解释：权重。取值范围： 0.0到1.0之间的浮点数。
regex	String	参数解释：正则表达式。取值范围：合法的正则表达式字符串。

表8 OpsTuningParamSetting
参数	参数类型	描述
actor_optimizer_lr	String	参数解释：优化器学习率，控制模型参数更新的步长。取值范围：科学计数法字符串，如1.0E-5。
train_batch_size	Integer	参数解释：批大小，单次训练迭代中使用的样本数量。取值范围：正整数。
rollout_num	Integer	参数解释：分组大小，GRPO算法中每次生成用于对比的样本组数量。取值范围：正整数。
epoch_num	Integer	参数解释：训练轮数，全量数据集被模型训练的次数。取值范围： 1到1000的正整数。
max_length	Integer	参数解释：最大长度，模型生成序列的最大Token数。取值范围： 1到100000的正整数。
ckpt_save_step	Integer	参数解释： step保存频率，每隔多少个训练步保存一次模型检查点。取值范围： 1到10000正整数。

表9 OpsDatasetInfo
参数	参数类型	描述
id	String	参数解释：数据集ID。取值范围：真实存在的数据集ID字符串。
version	String	参数解释：数据集版本号。取值范围：版本号字符串。
version_name	String	参数解释：版本显示名称。取值范围：版本显示名称字符串。

**表10** OpsFailDetail
参数	参数类型	描述
error_code	String	参数解释：错误码。取值范围：规范化的系统错误码字符串。
error_msg	String	参数解释：错误信息。取值范围：错误描述字符串。

**表11** OpsTasksTagForTMS
参数	参数类型	描述
key	String	参数解释：标签键。取值范围：不能为空或者空字符串，不能为空格，校验和使用之前先trim前后半角空格。最大长度128个unicode字符。
value	String	参数解释：值。取值范围：不校验字符集范围。每个值最大长度255个unicode字符。

状态码：404

**表12** 响应Body参数
参数	参数类型	描述
error_code	String	参数解释：机器可读的错误代码。取值范围：系统错误码字符串。
error_msg	String	参数解释：人类可读的错误消息。取值范围：详细错误说明字符串。

状态码：500

**表13** 响应Body参数
参数	参数类型	描述
error_code	String	参数解释：机器可读的错误代码。取值范围：系统错误码字符串。
error_msg	String	参数解释：人类可读的错误消息。取值范围：详细错误说明字符串。

请求示例

根据唯一ID获取单个优化任务的全量元数据，涵盖底层算力配置、详尽的超参数设定、数据集绑定及实时运行状态。

GET https://*.com/v1/ops/model-tuning-tasks/57ae91cf2f504899921a50d1c75f0547

Content-Type:application/json
X-Sdk-Date:20240416T095341Z
Authorization:SDK-HMAC-SHA256 Access=****************, SignedHeaders=content-type;host;x-sdk-date, Signature=****************

响应示例

状态码：200

{
  "id" : "57ae91cf2f504899921a50d1c75f0547",
  "name" : "test-tuning-task-01",
  "description" : "这是一个测试模型优化任务",
  "agent" : {
    "type" : "agent",
    "id" : "f0fab58d-8285-4c47-b856-1079cad579da",
    "version" : null,
    "node_type" : "intent_detection",
    "node_id" : "node_1773821451705"
  },
  "model_name" : "qwen3_8b",
  "train_agent" : {
    "id" : "train-agent-001",
    "version" : "1.0.0",
    "model_provider_id" : "provider-001",
    "model_id" : "model-001"
  },
  "training_type" : "rl",
  "tuning_method" : "grpo",
  "reward_setting" : {
    "reward_type" : "rule",
    "model_name" : null,
    "apikey_credential_provider" : null,
    "rubric" : null,
    "rules" : [ {
      "function_name" : "exact_match_reward",
      "weight" : 0.6,
      "regex" : "^[\\s\\S]*$"
    }, {
      "function_name" : "think_format_reward",
      "weight" : 0.4,
      "regex" : ""
    } ]
  },
  "parameter_setting" : {
    "actor_optimizer_lr" : "1.0E-5",
    "train_batch_size" : 8,
    "rollout_num" : 4,
    "epoch_num" : 3,
    "max_length" : 4096,
    "ckpt_save_step" : 100
  },
  "dataset" : {
    "id" : "b1ba4480-ad2d-4af6-8bae-af392b4eef83",
    "version" : "dd31db39-3973-4eff-b0e7-01a29454635b",
    "version_name" : "v1.0.0"
  },
  "validation_set_ratio" : 10,
  "train_product_path" : "obs://bucket-name/tuning/output/a1b2c3d4/",
  "agency_name" : "ops-tuning-agency",
  "status" : "training",
  "fail_detail" : null,
  "progress" : 35.5,
  "created_at" : 1744214400000,
  "updated_at" : 1744218000000,
  "executed_time" : 60,
  "tags" : [ {
    "key" : "project",
    "value" : "ops-demo"
  } ]
}

状态码

状态码	描述
200	参数解释：模型优化任务详情。取值范围：无
404	参数解释：模型优化任务未找到。取值范围：无
500	参数解释：内部服务器错误。取值范围：无

描述

200

参数解释：

模型优化任务详情。

取值范围：

无

404

参数解释：模型优化任务未找到。

取值范围：无

500

参数解释：内部服务器错误。

取值范围：无