文档首页/ 智果(AgentArts)智能体平台/ API参考/ API/ 评估/ 评估任务管理/ 校正评估结果 - UpdateOpsEvaluationTaskResult
更新时间:2026-06-16 GMT+08:00
分享

校正评估结果 - UpdateOpsEvaluationTaskResult

功能介绍

该接口用于对已生成的自动化评估结果执行人工校正,允许通过更新得分与修正理由来覆盖评价,确保最终评测结论的客观性与权威性。

调用方法

请参见如何调用API

授权信息

账号根用户具备所有API的调用权限,如果使用账号下的IAM用户调用当前API,该IAM用户需具备如下身份策略权限,更多的权限说明请参见权限和授权项

授权项

访问级别

资源类型(*为必须)

条件键

别名

依赖的授权项

agentarts:evaluationTask:updateOpsEvaluationTaskResult

Write

evaluationTask *

g:ResourceTag/<tag-key>

-

-

URI

PUT /v1/ops/evaluation-tasks/{task_id}/results/correction

表1 路径参数

参数

是否必选

参数类型

描述

task_id

String

参数解释:

需要执行更新或校正操作的目标评估任务唯一标识符(ID)。

约束限制:

字符串长度为0-100。

取值范围:

0-100字符。

默认取值:

不涉及。

请求参数

表2 请求Body参数

参数

是否必选

参数类型

描述

task_id

String

参数解释:

评估任务的唯一标识符(ID)。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

evaluator_id

String

参数解释:

执行评估的评估器唯一标识符。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

evaluator_version

String

参数解释:

评估器的版本号,用于精确锁定特定的评估算法版本。

约束限制:

长度为0到100个字符。

取值范围:

符合版本号格式的字符串,如"v1.0.0"

默认取值:

不涉及。

item_id

String

参数解释:

具体需要校正的评估条目(Item)唯一标识符。

约束限制:

长度为0到100个字符。

取值范围:

不涉及。

默认取值:

不涉及。

correction

correction object

参数解释:

包含校正详情的对象,包括校正原因和最终得分。

约束限制:

reason和score均必填。

表3 correction

参数

是否必选

参数类型

描述

reason

String

参数解释:

校正评估结果的具体原因说明。

约束限制:

长度为1到 2000个字符。

取值范围:

不涉及。

默认取值:

不涉及。

score

String

参数解释:

校正后的新评估分数。

约束限制:

固定长度为3个字符。

取值范围:

0到1之间的数字字符串,保留1位小数(如 "1.0", "0.5")。

默认取值:

不涉及。

响应参数

状态码:200

获取任务详情

请求示例

人工干预并校正特定评估条目的得分和理由,以覆盖自动化评估器的原始输出。

PUT https://*.com/agentarts/v1/ops/evaluation-tasks/1769496108575576900361/results/correction

{
  "task_id" : "1769496108575576900361",
  "evaluator_id" : "2",
  "evaluator_version" : "3",
  "item_id" : "x",
  "correction" : {
    "reason" : "正确",
    "score" : 0.8
  }
}

响应示例

状态码:200

获取任务详情

{
  "code" : 0,
  "data" : null,
  "msg" : "success"
}

状态码

状态码

描述

200

获取任务详情

错误码

请参见错误码

相关文档