文档首页/ 智能体开发平台 AgentArts/ API参考/ API/ 评估/ 评估任务管理/ 校正评估结果 - UpdateOpsEvaluationTaskResult
更新时间:2026-04-15 GMT+08:00
分享

校正评估结果 - UpdateOpsEvaluationTaskResult

功能介绍

该接口用于对已生成的自动化评估结果执行人工校正,允许通过更新得分与修正理由来覆盖评价,确保最终评测结论的客观性与权威性。

URI

PUT /v1/ops/evaluation-tasks/{task_id}/results/correction

表1 路径参数

参数

是否必选

参数类型

描述

task_id

String

参数解释:

需要执行更新或校正操作的目标评估任务唯一标识符(ID)。

约束限制:

字符串长度为0到100。

取值范围:

0-100字符。

默认取值:

不涉及。

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

Content-Type

String

参数解释:

消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

application/json

Authorization

String

参数解释:

签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

X-Sdk-Date

String

参数解释:

请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

表3 请求Body参数

参数

是否必选

参数类型

描述

task_id

String

参数解释:

评估任务的唯一标识符(ID)。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

evaluator_id

String

参数解释:

执行评估的评估器唯一标识符。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

evaluator_version

String

参数解释:

评估器的版本号,用于精确锁定特定的评估算法版本。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

item_id

String

参数解释:

具体需要校正的评估条目(Item)唯一标识符。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

correction

correction object

参数解释:

包含校正详情的对象,包括校正原因和最终得分。

约束限制:

reason和score均必填。

取值范围:

不涉及。

默认取值:

不涉及。

表4 correction

参数

是否必选

参数类型

描述

reason

String

参数解释:

校正评估结果的具体原因说明。

约束限制:

长度为1到 2000个字符。

取值范围:

不涉及。

默认取值:

不涉及。

score

String

参数解释:

校正后的新评估分数。

约束限制:

固定长度为 3个字符。

取值范围:

数字字符串(如 "1.0", "0.5")。

默认取值:

不涉及。

响应参数

状态码:200

获取任务详情

请求示例

人工干预并校正特定评估条目的得分和理由,以覆盖自动化评估器的原始输出。

PUT https://*.com/agentarts/v1/ops/evaluation-tasks/1769496108575576900361/results/correction

{
  "task_id" : "1769496108575576900361",
  "evaluator_id" : "2",
  "evaluator_version" : "3",
  "item_id" : "x",
  "correction" : {
    "reason" : "正确",
    "score" : 0.8
  }
}

响应示例

状态码:200

获取任务详情

{
  "code" : 0,
  "data" : null,
  "msg" : "success"
}

状态码

状态码

描述

200

获取任务详情

错误码

请参见错误码

相关文档