文档首页/ 智能体开发平台 AgentArts/ API参考/ API/ 评估/ 评估任务管理/ 某个任务的所有评估器得分统计 - ShowOpsEvaluationTaskChartsScoreStats
更新时间:2026-04-15 GMT+08:00
分享

某个任务的所有评估器得分统计 - ShowOpsEvaluationTaskChartsScoreStats

功能介绍

该接口用于获取指定评测任务中各评估维度的得分分布与汇总统计,通过聚合多个评估器的分值数据,生成反映模型各方面能力指标视图。

适用场景:

  • 模型能力多维诊断:对比同一任务下不同评估器(如:逻辑性得分 vs 准确性得分)的统计表现,精准识别模型的优势与短板。

  • 评测结果横向对比:汇总多个评估因子的平均分、标准差等指标,为模型版本的择优准入提供数据支撑。

  • 质量分布趋势分析:通过得分统计识别评分异常区间(如:评分分布过于集中或离散),评估当前评测集难度与评估器判分逻辑的合理性。

URI

GET /v1/ops/evaluation-tasks/{task_id}/charts/score-stats

表1 路径参数

参数

是否必选

参数类型

描述

task_id

String

参数解释:

评估任务的唯一标识符ID,用于在路径中指定操作的目标任务。

约束限制:

字符串长度为0到100。

取值范围:

0-100字符。

默认取值:

不涉及。

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

Content-Type

String

参数解释:

消息体编码格式。用于告知服务端请求体(Body)所采用的主体数据类型,以便服务端正确解析。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

application/json

Authorization

String

参数解释:

签名认证信息,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

X-Sdk-Date

String

参数解释:

请求发送的时间,当使用AK/SK方式认证时,使用SDK对请求进行签名的过程中会自动填充该字段。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

响应参数

状态码:200

返回评测任务中各评估维度的得分分布与汇总统计

请求示例

请求评测任务中各评估维度的得分分布与汇总统计

GET https://*.com/agentarts/v1/ops/evaluation-tasks/a67452bf21f819-6f91-4568-9f2f-57ef9562ab7b/charts/score-stats

响应示例

状态码:200

返回评测任务中各评估维度的得分分布与汇总统计

{
  "headers": {
    "Content-Type": "application/json"
  },
  "body": {
    "data": {
  "data": {
    "evaluators": [
      {
        "avg_score": 0.25,
        "evaluator_id": "98527a44-52c5-4ce0-a918-8968081606b4",
        "evaluator_name": "正确性",
        "max_score": 0.3,
        "min_score": 0.2,
        "sum_score": 0.5
      },
      {
        "avg_score": 0.25,
        "evaluator_id": "98527a44-52c5-4ce0-a918-8968081606b4",
        "evaluator_name": "正确性",
        "max_score": 0.3,
        "min_score": 0.2,
        "sum_score": 0.5
      }
    ]
  }
}
}

状态码

状态码

描述

200

返回评测任务中各评估维度的得分分布与汇总统计

错误码

请参见错误码

相关文档