数学表达式相等判断
数学表达式相等判断评估器
|
分类 |
详情 |
|
|---|---|---|
|
基础信息 |
评估器名称 |
数学表达式相等判断。 |
|
效果说明 |
功能概述 |
检查智能体输出的数学表达式数学含义是否完全相等。 |
|
评估方式 |
代码评估。 |
|
|
评估目标 |
数学表达式、相等判断。 |
|
|
适用场景 |
离线评估 |
|
|
应用场景 |
需要判断两个数学表达式是否相等。 |
|
|
评分标准 |
1.0分 |
两个数学表达式相等。 |
|
0.0分 |
两个数学表达式不相等。 |
|
评估器参数说明:
|
参数类型 |
参数名称 |
是否必填 |
参数说明 |
|---|---|---|---|
|
输入参数 |
actual_output |
是 |
实际输出的数学表达式。 |
|
reference_output |
是 |
参考数学表达式。 |
|
|
输出参数 |
score |
是 |
评估得分(0.0 / 1.0)。 |
|
reason |
是 |
评分理由说明。 |
使用该评估器前,需要在评测集中为每条测试数据准备好reference_output(标准参考答案)。评估时平台会自动将智能体的实际输出填入actual_output,两项数据共同传入评估器进行评分。各字段的推荐映射方式如下:
输入格式示例:
{
"actual_output": "x^2 + 2x + 1",
"reference_output": "(x+1)^2"
}
输出格式示例:
{
"score": 1.0,
"reason": "actual_output和reference_output相等,actual_output=x^2 + 2x + 1, reference_output=(x+1)^2"
}