文档首页/ 智能体开发平台 AgentArts/ API参考/ API/ 评估/ 评估任务管理/ 查看任务评估结果 - ListOpsEvaluationTaskResults

更新时间：2026-04-15 GMT+08:00

查看PDF

查看任务评估结果 - ListOpsEvaluationTaskResults

功能介绍

该接口用于获取评估任务的详细评估结果，包括各项评估指标的分数、用时和详细信息，适用于任务结果分析和质量评估的场景。

URI

POST /v1/ops/evaluation-tasks/{task_id}/results

表1 路径参数
参数	是否必选	参数类型	描述
task_id	是	String	参数解释：需要查询结果的评估任务唯一标识符（ID）。约束限制：字符串长度为0到100。取值范围：不涉及。默认取值：不涉及。

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
Content-Type	是	String	参数解释：消息体编码格式。用于告知服务端请求体（Body）所采用的主体数据类型，以便服务端正确解析。约束限制：不涉及取值范围：不涉及默认取值： application/json
Authorization	是	String	参数解释：签名认证信息，当使用AK/SK方式认证时，使用SDK对请求进行签名的过程中会自动填充该字段。约束限制：不涉及取值范围：不涉及默认取值：不涉及
X-Sdk-Date	是	String	参数解释：请求发送的时间，当使用AK/SK方式认证时，使用SDK对请求进行签名的过程中会自动填充该字段。约束限制：不涉及取值范围：不涉及默认取值：不涉及

表3 请求Body参数
参数	是否必选	参数类型	描述
offset	是	Integer	参数解释：指定分页查询的起始偏移量。约束限制： 1到10000之间的整数。取值范围： 1到 10000。默认取值： 1。
limit	是	Integer	参数解释：指定单页返回的结果数量。约束限制： 1到100之间的整数。取值范围： 1到100。默认取值： 10。
filters	否	Object	参数解释：任务过滤条件对象，支持模糊查询，用于精准筛选评估结果。约束限制：符合业务逻辑的JSON对象。取值范围：不涉及。默认取值：空对象。

响应参数

状态码：200

当前任务的评估详情

无

请求示例

获取指定评估任务的详细结果，包含每条测试数据的评分、原因及处理耗时。

POST https://*.com/agentarts/v1/ops/evaluation-tasks/task_7590068991923321000/results

{
  "offset" : 1,
  "limit" : 10,
  "filters" : {
    "min_score" : 0,
    "max_score" : 10
  }
}

响应示例

状态码：200

当前任务的评估详情

{
  "data" : {
    "items" : [ {
      "item_id" : "item-f80ce759-490a-4472-b779-80dc5e564f5b",
      "dataset_name" : "dataset_name",
      "evaluations" : [ {
        "score" : 0.8,
        "reason" : "回答完全正确",
        "latency_s" : 20
      } ]
    } ],
    "total" : 1
  }
}

状态码

状态码	描述
200	当前任务的评估详情

错误码

请参见错误码。

父主题： 评估任务管理

上一篇：查看评估任务列表 - ListOpsEvaluationTasks

下一篇：校正评估结果 - UpdateOpsEvaluationTaskResult

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问