更新时间:2026-03-09 GMT+08:00
分享

AI味检查

AI味检测评估器

表1 评估器信息

分类

详情

基础信息

评估器名称

AI味检查

效果说明

功能概述

评估模型回复中是否存在开头结尾话术冗余、连接词模板化、人物名称简单化、语气词过多等问题。

评估方式

LLM评估

评估目标

文本、输出质量

应用场景

检测模型输出是否带有明显的"AI生成痕迹",适用于内容创作、客服对话、营销文案等需要拟人化表达的场景,确保回复自然流畅、贴近真人写作风格。

评分标准

1.0分

文本表达自然、地道,直接切入主题。连接词顺滑,无明显的模板化痕迹,像是由具备专业素养的人类撰写的。

0.0分

回复存在明显的AI生成痕迹;开头结尾话术冗余、连接词模板化、人物名称简单化。

评估器参数说明:

表2 评估器参数说明

参数类型

参数名称

是否必填

参数说明

输入参数

input

用户的输入问题,提供评估的上下文背景。

actual_output

智能体针对该问题的实际输出结果。

输出参数

score

-

评估得分(0.0/1.0)。

reason

-

评分理由说明。

输入格式示例:

{
  "input": "写一个关于夏天的小故事。",
  "actual_output": "夏天来了,天气很热。我去了海边。海边有很多人。我玩得很开心。希望这能帮到您。"
}

输出格式示例:

{
  "score": 0,
  "reason": "回复存在明显AI味,开头无自然切入,结尾包含典型AI客套话希望这能帮到您。"
}

相关文档