格式检查
格式检查评估器
|
分类 |
详情 |
|
|---|---|---|
|
基础信息 |
评估器名称 |
格式检查 |
|
效果说明 |
功能概述 |
对模型回复中序号、引用、角标、上标、符号规范及排版逻辑的错误检查。 |
|
评估方式 |
LLM评估 |
|
|
评估目标 |
文本、输出质量 |
|
|
应用场景 |
适用于学术写作、技术文档、法律合同、出版物等对格式规范性要求严格的场景,确保模型输出符合排版标准,避免因格式错误导致信息误读或专业性受损。 |
|
|
评分标准 |
1.0分 |
格式完全规范,序号连续正确,引用、角标、上标使用准确,符号统一,排版逻辑清晰,无格式错误。 |
|
0.0分 |
格式存在错误,包括序号混乱/断档、引用缺失或错位、角标/上标误用、符号混用、排版逻辑混乱等。 |
|
评估器参数说明:
|
参数类型 |
参数名称 |
是否必填 |
参数说明 |
|---|---|---|---|
|
输入参数 |
actual_output |
是 |
智能体针对该问题的实际输出结果。 |
|
输出参数 |
score |
是 |
评估得分(0.0 / 1.0)。 |
|
reason |
是 |
评分理由说明。 |
输入格式示例:
{
"actual_output": "The area is 10m2. See reference [3].\n\n[1] Smith et al., 2023."
}
输出格式示例:
{
"score": 0.0,
"reason": "上标 "m2" 应为 "m²",存在渲染错误;引用编号 [3] 未在参考文献中出现,存在断号。"
}