知识问答-便捷性
知识问答-便捷性评估器
|
分类 |
详情 |
|
|---|---|---|
|
基础信息 |
评估器名称 |
知识问答-便捷性 |
|
效果说明 |
功能概述 |
考察回复的结构组织是否合理,核心答案是否突出且便于快速阅读,避免大篇幅混乱或核心信息滞后。 |
|
评估方式 |
LLM问答 |
|
|
评估目标 |
文本、输出质量 |
|
|
应用场景 |
适用于阅读、快速决策、信息检索等场景,确保模型输出结构清晰、核心答案前置,用户无需在冗长文本中寻找关键信息,提升信息获取效率。 |
|
|
评分标准 |
1.0分 |
结构组织极佳,核心答案突出前置,层次分明,便于快速定位关键信息,阅读体验流畅。 |
|
0.75 |
结构组织良好,核心答案较清晰,层次基本合理,偶有次要信息前置但不影响快速阅读。 |
|
|
0.5 |
结构组织一般,核心答案位置偏后或不够突出,层次略显混乱,需一定时间筛选信息。 |
|
|
0.25分 |
结构组织较差,核心答案滞后或淹没在大篇幅内容中,层次混乱,快速阅读困难。 |
|
|
0.0分 |
结构极差,无组织逻辑,核心答案难以辨识,大篇幅混乱堆砌,完全不便于阅读。 |
|
评估器参数说明:
|
参数类型 |
参数名称 |
是否必填 |
参数说明 |
|---|---|---|---|
|
输入参数 |
input |
是 |
用户的输入问题,提供评估的上下文背景。 |
|
actual_output |
是 |
智能体针对该问题的实际输出结果。 |
|
|
输出参数 |
score |
是 |
评估得分(0.0 / 0.25 / 0.5 / 0.75 / 1.0)。 |
|
reason |
是 |
评分理由说明。 |
输入格式示例:
{
"input": "如何提高睡眠质量?",
"actual_output": "提高睡眠质量是一个复杂的问题,涉及多个生理和心理因素。首先,你需要保持规律的作息时间,避免在睡前使用电子设备,因为蓝光会抑制褪黑素分泌。其次,环境也很重要,比如温度、噪音、床垫舒适度。另外,饮食方面,避免睡前摄入咖啡因和酒精。最后,可以尝试冥想或深呼吸练习来放松身心。总之,综合调整生活习惯才能有效改善睡眠。"
}
输出格式示例:
{
"score": 0.25,
"reason": "回复为大段文字墙,无分段、无列表、无重点标注,核心建议被埋没在冗长叙述中,视觉噪音极高。"
}