知识问答-便捷性

知识问答-便捷性评估器

表1 评估器信息
分类		详情
基础信息	评估器名称	知识问答-便捷性
效果说明	功能概述	考察回复的结构组织是否合理，核心答案是否突出且便于快速阅读，避免大篇幅混乱或核心信息滞后。
	评估方式	LLM问答
	评估目标	文本、输出质量
	应用场景	适用于阅读、快速决策、信息检索等场景，确保模型输出结构清晰、核心答案前置，用户无需在冗长文本中寻找关键信息，提升信息获取效率。
评分标准	1.0分	结构组织极佳，核心答案突出前置，层次分明，便于快速定位关键信息，阅读体验流畅。
	0.75	结构组织良好，核心答案较清晰，层次基本合理，偶有次要信息前置但不影响快速阅读。
	0.5	结构组织一般，核心答案位置偏后或不够突出，层次略显混乱，需一定时间筛选信息。
	0.25分	结构组织较差，核心答案滞后或淹没在大篇幅内容中，层次混乱，快速阅读困难。
	0.0分	结构极差，无组织逻辑，核心答案难以辨识，大篇幅混乱堆砌，完全不便于阅读。

评估器参数说明：

表2 评估器参数说明
参数类型	参数名称	是否必填	参数说明
输入参数	input	是	用户的输入问题，提供评估的上下文背景。
输入参数	actual_output	是	智能体针对该问题的实际输出结果。
输出参数	score	是	评估得分（0.0 / 0.25 / 0.5 / 0.75 / 1.0）。
输出参数	reason	是	评分理由说明。

输入格式示例：

{
  "input": "如何提高睡眠质量？",
  "actual_output": "提高睡眠质量是一个复杂的问题，涉及多个生理和心理因素。首先，你需要保持规律的作息时间，避免在睡前使用电子设备，因为蓝光会抑制褪黑素分泌。其次，环境也很重要，比如温度、噪音、床垫舒适度。另外，饮食方面，避免睡前摄入咖啡因和酒精。最后，可以尝试冥想或深呼吸练习来放松身心。总之，综合调整生活习惯才能有效改善睡眠。"
}

输出格式示例：

{
  "score": 0.25,
  "reason": "回复为大段文字墙，无分段、无列表、无重点标注，核心建议被埋没在冗长叙述中，视觉噪音极高。"
}

父主题：预置评估器

上一篇：知识问答-精练性

下一篇：知识问答-丰富度

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问

知识问答-便捷性

相关文档

意见反馈

文档内容是否对您有帮助？