格式检查

格式检查评估器

表1 评估器信息
分类		详情
基础信息	评估器名称	格式检查
效果说明	功能概述	对模型回复中序号、引用、角标、上标、符号规范及排版逻辑的错误检查。
	评估方式	LLM评估
	评估目标	文本、输出质量
	应用场景	适用于学术写作、技术文档、法律合同、出版物等对格式规范性要求严格的场景，确保模型输出符合排版标准，避免因格式错误导致信息误读或专业性受损。
评分标准	1.0分	格式完全规范，序号连续正确，引用、角标、上标使用准确，符号统一，排版逻辑清晰，无格式错误。
评分标准	0.0分	格式存在错误，包括序号混乱/断档、引用缺失或错位、角标/上标误用、符号混用、排版逻辑混乱等。

评估器参数说明：

输入格式示例：

{
  "actual_output": "The area is 10m2. See reference [3].\n\n[1] Smith et al., 2023."
}

输出格式示例：

{
  "score": 0.0,
  "reason": "上标 "m2" 应为 "m²"，存在渲染错误；引用编号 [3] 未在参考文献中出现，存在断号。"
}

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨