更新时间:2026-03-09 GMT+08:00
分享

知识问答-便捷性

知识问答-便捷性评估器

表1 评估器信息

分类

详情

基础信息

评估器名称

知识问答-便捷性

效果说明

功能概述

考察回复的结构组织是否合理,核心答案是否突出且便于快速阅读,避免大篇幅混乱或核心信息滞后。

评估方式

LLM问答

评估目标

文本、输出质量

应用场景

适用于阅读、快速决策、信息检索等场景,确保模型输出结构清晰、核心答案前置,用户无需在冗长文本中寻找关键信息,提升信息获取效率。

评分标准

1.0分

结构组织极佳,核心答案突出前置,层次分明,便于快速定位关键信息,阅读体验流畅。

0.75

结构组织良好,核心答案较清晰,层次基本合理,偶有次要信息前置但不影响快速阅读。

0.5

结构组织一般,核心答案位置偏后或不够突出,层次略显混乱,需一定时间筛选信息。

0.25分

结构组织较差,核心答案滞后或淹没在大篇幅内容中,层次混乱,快速阅读困难。

0.0分

结构极差,无组织逻辑,核心答案难以辨识,大篇幅混乱堆砌,完全不便于阅读。

评估器参数说明:

表2 评估器参数说明

参数类型

参数名称

是否必填

参数说明

输入参数

input

用户的输入问题,提供评估的上下文背景。

actual_output

智能体针对该问题的实际输出结果。

输出参数

score

评估得分(0.0 / 0.25 / 0.5 / 0.75 / 1.0)。

reason

评分理由说明。

输入格式示例:

{
  "input": "如何提高睡眠质量?",
  "actual_output": "提高睡眠质量是一个复杂的问题,涉及多个生理和心理因素。首先,你需要保持规律的作息时间,避免在睡前使用电子设备,因为蓝光会抑制褪黑素分泌。其次,环境也很重要,比如温度、噪音、床垫舒适度。另外,饮食方面,避免睡前摄入咖啡因和酒精。最后,可以尝试冥想或深呼吸练习来放松身心。总之,综合调整生活习惯才能有效改善睡眠。"
}

输出格式示例:

{
  "score": 0.25,
  "reason": "回复为大段文字墙,无分段、无列表、无重点标注,核心建议被埋没在冗长叙述中,视觉噪音极高。"
}

相关文档