AI味检查
AI味检测评估器
|
分类 |
详情 |
|
|---|---|---|
|
基础信息 |
评估器名称 |
AI味检查 |
|
效果说明 |
功能概述 |
评估模型回复中是否存在开头结尾话术冗余、连接词模板化、人物名称简单化、语气词过多等问题。 |
|
评估方式 |
LLM评估 |
|
|
评估目标 |
文本、输出质量 |
|
|
应用场景 |
检测模型输出是否带有明显的"AI生成痕迹",适用于内容创作、客服对话、营销文案等需要拟人化表达的场景,确保回复自然流畅、贴近真人写作风格。 |
|
|
评分标准 |
1.0分 |
文本表达自然、地道,直接切入主题。连接词顺滑,无明显的模板化痕迹,像是由具备专业素养的人类撰写的。 |
|
0.0分 |
回复存在明显的AI生成痕迹;开头结尾话术冗余、连接词模板化、人物名称简单化。 |
|
评估器参数说明:
|
参数类型 |
参数名称 |
是否必填 |
参数说明 |
|---|---|---|---|
|
输入参数 |
input |
是 |
用户的输入问题,提供评估的上下文背景。 |
|
actual_output |
是 |
智能体针对该问题的实际输出结果。 |
|
|
输出参数 |
score |
- |
评估得分(0.0/1.0)。 |
|
reason |
- |
评分理由说明。 |
输入格式示例:
{
"input": "写一个关于夏天的小故事。",
"actual_output": "夏天来了,天气很热。我去了海边。海边有很多人。我玩得很开心。希望这能帮到您。"
}
输出格式示例:
{
"score": 0,
"reason": "回复存在明显AI味,开头无自然切入,结尾包含典型AI客套话希望这能帮到您。"
}