优化提示词
优化提示词,是让智能体从“机械应答”走向“懂场景、懂用户、懂规则”的关键一步,它不仅提升回答质量,更构建了可复用、可迭代、可扩展的智能服务基础。
提示词优化任务的三大关键设计:
|
机制 |
作用说明 |
|---|---|
|
变量注入机制 |
允许动态插入用户输入或上下文信息(如城市、预算、人群类型),使提示词具备上下文感知能力,实现“千人千面”的个性化响应。 |
|
评测集驱动训练 |
提供真实场景下的“输入-输出”示例,帮助模型学习“正确回答方式”,确保输出结构清晰、内容完整、符合预期。 |
|
背景知识注入 |
补充行业常识或领域知识(如“西安有兵马俑”),增强模型的专业判断力与逻辑完整性。 |
为什么要进行提示词优化?
因为提示词,是智能体“理解用户、执行任务、生成回答”的第一道指令。它决定了智能体是否“听得懂”问题、是否“想得清”逻辑、是否“说得对”内容。
如果提示词设计粗糙、模糊或不完整,智能体就会“瞎猜”“胡编”“答非所问”,哪怕模型再强大,也无济于事。
所以,提示词优化,不是“锦上添花”,而是“根本性提升”:
|
优化方向 |
原始问题 |
优化后效果 |
|---|---|---|
|
理解能力 |
智能体无法识别用户真实意图(如“带孩子去北京”,是亲子游?是研学?还是打卡?) |
通过变量与背景知识,明确场景边界,精准捕捉用户需求 |
|
输出质量 |
回答信息缺失、结构混乱、缺乏细节 |
输出结构清晰、内容完整、有时间/地点/费用/建议等关键要素 |
|
用户体验 |
用户需反复追问、纠错、重试 |
回答自然、贴切、有温度,一次到位,提升满意度 |
|
可复用性 |
每次都要重新写提示词,效率极低 |
通过变量机制,一套提示词适配多种场景,实现“一模多用” |
前提条件
约束与限制
在创建提示词优化任务时,变量数据评测集的数量不能超过500个。
优化提示词
- 登录AgentArts智能体开发平台。
- 单击左侧导航栏,单击左上角“提示词”页签,进入提示词管理界面。
- 选择“优化任务”页签,并单击“新建优化任务”。
- 填写信息与用例集,如图1所示。配置完成后单击“下一步”继续进行后续的操作。
表3 填写信息与用例集参数说明 参数
说明
示例
任务名称
用于标识任务的唯一名称。
旅游风土人情介绍优化
任务描述
补充说明任务的信息。
优化目的地介绍的准确性与文化深度
选择提示词应用对象
选择要使用的模型,已接入的模型服务详见模型。
DeepSeek-V3
类型
选择优化任务类型。
- 文本:表示该提示词可以包含文本变量。文本变量可以是任何文本内容,如句子、段落、关键词等。
- 多模态:表示该提示词可以包含文本变量和图片变量。文本变量和图片变量可以结合使用,以提供更丰富的信息。
文本
提示词
提示词是用来引导模型生成的一段内容。撰写的提示词应该包含任务或领域的关键信息,如主题、风格、格式等。以下是几种添加提示词内容的方式:
- 直接编写:在提示词编辑框中直接手动输入指令内容。
- 智能优化:单击提示词编辑框右上角的“
智能优化提示词”,利用大模型能力辅助编写。
撰写提示词时,为了提升提示词的灵活性和复用性,支持在提示词中插入变量。模型在运行时会根据实际输入的变量值动态生成文本。
在提示词中输入{{ }}引用变量,或单击提示词编辑框右上角的“引用变量”按钮,设置提示词变量。
你是一个旅游助手,需要给用户介绍旅行地的风土人情。请介绍下{{location}}的风土人情。变量数据评测集
用于帮助模型更高效地学习,指导提示词优化的一组数据。
- 手动添加用例:在右侧的“变量数据评测集”区域,单击“添加用例”按钮,手动输入变量的具体内容和期望的输出结果。每添加一个用例后,单击“保存”,保存添加的用例。
- 批量导入用例:如果您之前已经创建了用例集,可以选择“导入”按钮,批量上传用例。系统会自动将选定的数据集中的变量与您的提示词进行组合。
说明:
- 导入数据应不超过500条,超过数量不允许导入。
- 如果导入的数据中存在与系统中已有数据完全相同的记录,这些记录将不会被再次导入。
- 导入的文件仅支持json、xlsx格式,以及包含上述格式文件的zip压缩包。
图2 数据评测集示例
- 配置优化策略,如图3所示。配置完成后单击“立即创建”。
表4 配置优化策略参数说明 参数
说明
示例
基础配置
提示词优化模型
选择要使用的模型,已接入的模型服务详见模型。
DeepSeek-V3
任务开始时间
用于优化任务开始时间的设置。
- 立即开始:优化任务将在配置完成后启动。
- 稍后开始:优化任务将根据用户指定的时间开始执行。
立即开始
优化最大轮次
表示系统将尝试优化提示词的最大次数。优化轮次多可提升优化效果,但会增加优化时间。
取值范围:0~20
3
任务配置
提示词示例个数
在提示词中添加具体的回复示例,将提升大模型的理解和回答的准确性,示例越多回答越精准,但消耗的token越多。
取值范围:0~5
2
任务类型
优化任务的分类方式。
- 主观任务:适用于创作类等没有标准答案的场景,优化时将明确主观偏好。
- 客观任务:适用于分类或意图识别等有标准答案的场景,优化时将明确客观标准。
主观任务
高级配置(可选)
评分标准
用于补充输出的评分标准,例如,顺序是否影响,回答需要包括哪些要点等。可以结合优化任务详情-评分原因,根据任务的具体要求,设定评分规则。
取值范围:不大于1000的字符。
0分:文字堆砌,无支撑的夸张表述 3分:包含景点介绍 5分:包含景点介绍以及周边美食推荐
背景知识
用于补充一些特定领域的知识给优化提示词模型,模型可以选择是否将这些知识添加到提示词中,以提高任务的执行效果。
取值范围:不大于1000的字符。
北京是中国的首都,也是历史文化名城,拥有丰富的风土人情和独特的城市魅力。以下是对北京风土人情的详细介绍: 一、历史与文化 北京有着三千多年的历史,曾是多个朝代的都城,如元、明、清等。这里是中国传统文化的重要发源地之一,拥有众多历史遗迹和文化景观,如故宫、天坛、颐和园等。北京的文化底蕴深厚,京剧、书法、篆刻、剪纸等传统艺术在这里得到了很好的传承和发展。 二、饮食文化 北京的饮食文化极具特色,代表性的美食有: 北京烤鸭:以皮脆肉嫩、香气扑鼻而闻名,是北京的“名片”之一。 炸酱面:地道的北京家常面食,酱香浓郁,配料丰富。 豆汁儿:一种发酵的豆制品饮品,味道独特,是老北京人早餐的常见选择。 卤煮火烧:一种以猪杂为主料的汤煮小吃,味道鲜美,深受本地人喜爱。
- 创建完成后,你可以在“开发中心 > 组件库 > 提示词”界面中的“优化任务”页签中查看创建的提示词优化任务。
更多操作
创建提示词优化任务后,在“优化任务”界面,您可以通过任务状态和任务类型筛选功能,或使用关键字搜索功能来查找提示词优化任务。此外,您还可以对提示词优化任务进行删除、编辑等操作,详情请参见管理提示词。

