优化提示词

提示词优化，是让智能体从“机械应答”走向“懂场景、懂用户、懂规则”的关键一步，它不仅提升回答质量，更构建了可复用、可迭代、可扩展的智能服务基础。

提示词优化任务的三大关键设计：

表1 三大关键设计
机制	作用说明
变量注入机制	允许动态插入用户输入或上下文信息（如城市、预算、人群类型），使提示词具备上下文感知能力，实现“千人千面”的个性化响应。生效方式：在提示词中通过{{变量名}}占位，运行时由系统自动替换为实际输入值。
评测集驱动迭代	提供真实场景下的“输入-输出”示例，帮助模型学习“正确回答方式”，确保输出结构清晰、内容完整、符合预期。生效方式：系统将评测集中的输入代入提示词生成回答，与期望输出对比评分，据此迭代改写提示词。
背景知识注入	补充行业常识或领域知识（如“西安有兵马俑”），增强模型的专业判断力与逻辑完整性。生效方式：系统根据评分结果，选择性地将背景知识融入优化后的提示词中，弥补模型在特定领域的知识盲区。

为什么要进行提示词优化？

因为提示词是智能体“理解用户、执行任务、生成回答”的第一道指令。它决定了智能体是否“听得懂”问题、是否“想得清”逻辑、是否“说得对”内容。

如果提示词设计粗糙、模糊或不完整，智能体就会“瞎猜、胡编、答非所问”，哪怕模型再强大，也难以输出符合预期的结果。

所以，提示词优化，不是“锦上添花”，而是“根本性提升”。

前提条件

已开通AgentArts服务。

约束与限制

在创建提示词优化任务时，变量数据评测集内的数据条数不能超过500条。
提示词中必须包含变量，才能创建优化任务。

优化提示词

登录AgentArts智能体平台。
单击左侧导航栏“开发中心 > 组件库 ”，单击左上角“提示词”页签，进入提示词管理页面。
选择“优化任务”页签，并单击“新建优化任务”。

填写提示词基础信息与用例集，如图1所示。配置完成后单击“下一步”继续进行后续的操作。

图1 填写信息与用例集
点击放大

表2 填写信息与用例集参数说明
参数	说明	示例
任务名称	必选参数。用于标识任务的唯一名称。长度限制：1~64个字符。	旅游风土人情介绍优化
任务描述	必选参数。补充说明任务的信息。长度限制：1~256个字符。	优化目的地介绍的准确性与文化深度
选择提示词应用对象	必选参数。选择要使用的模型，已接入的模型服务详见模型。	DeepSeek-V3
类型	必选参数。选择优化任务类型。如果您的场景为文案创作、摘要生成等无唯一标准答案的任务，请选择‘主观任务’（如：旅游攻略生成）；如果为意图识别、文本分类等有明确对错的任务，请选择‘客观任务’（如：用户意图识别）。文本：表示该提示词可以包含文本变量。适用于纯文本问答、摘要生成、代码编写等仅涉及文字交互的场景。多模态：表示该提示词可以包含文本变量和图片变量。适用于需要结合图片进行分析、描述或生成的场景（如看图写文、图像内容审核）。	文本
提示词	提示词是用来引导模型生成的一段内容。撰写的提示词应该包含任务或领域的关键信息，如主题、风格、格式等。以下是几种添加提示词内容的方式：直接编写：在提示词编辑框中直接手动输入指令内容。智能优化：单击提示词编辑框右上角的“智能优化提示词”，利用大模型能力辅助编写。引用提示词示例：单击提示词输入框下方的示例，系统会自动将选定的提示词填充到编辑框中。撰写提示词时，为了提升提示词的灵活性和复用性，支持在提示词中插入变量。模型在运行时会根据实际输入的变量值动态生成文本。在提示词中输入{{ }}引用变量，或单击提示词编辑框右上角的“引用变量”按钮，设置提示词变量。	你是一个旅游助手，需要给用户介绍旅行地的风土人情。请介绍下{{location}}的风土人情。
变量数据评测集	必选参数。用于帮助模型更高效地学习，指导提示词优化的一组数据。手动添加用例：在右侧的“变量数据评测集”区域，单击“添加用例”按钮，手动输入变量的具体内容和期望的输出结果。每添加一个用例后，单击“保存”，保存添加的用例。批量导入用例：如果您之前已经创建了用例集，可以选择“导入”按钮，批量上传用例。系统会自动将选定的数据集中的变量与您的提示词进行组合。如果导入失败，请检查文件格式是否符合模板要求，常见错误请参考常见问题。说明：如果导入的数据中存在与系统中已有数据完全相同的记录，这些记录将不会被再次导入。导入的文件仅支持json、xlsx格式，以及包含上述格式文件的zip压缩包。	图2 数据评测集示例

配置优化策略，如图3所示。配置完成后单击“立即创建”。

图3 配置优化策略

表3 配置优化策略参数说明
参数		说明	示例
基础配置	提示词优化模型	选择要使用的模型，已接入的模型服务详见模型。	DeepSeek-V3
	任务开始时间	用于优化任务开始时间的设置。立即开始：优化任务将在配置完成后启动。稍后开始：优化任务将根据用户指定的时间开始执行。	立即开始
	优化最大轮次	表示系统将尝试优化提示词的最大次数。优化轮次多可提升优化效果，但会增加优化时间。取值范围：1~20	3
任务配置	提示词示例个数	在提示词中添加具体的回复示例，将提升大模型的理解和回答的准确性，示例越多回答越精准，但消耗的token越多。默认值：1 取值范围：0~5	2
任务配置	任务类型	优化任务的分类方式。如果您的场景为文案创作、摘要生成等无唯一标准答案的任务，请选择“主观任务”；如果为意图识别、文本分类等有明确对错的任务，请选择“客观任务”。主观任务：适用于创作类等没有标准答案的场景，优化时将明确主观偏好。客观任务：适用于分类或意图识别等有标准答案的场景，优化时将明确客观标准。	主观任务
高级配置（可选）	评分标准	用于补充输出的评分标准，例如，顺序是否影响，回答需要包括哪些要点等。可以结合优化任务详情中的评分原因，根据任务的具体要求设定评分规则。取值范围：不大于1000的字符。	0分：文字堆砌，缺乏依据的夸张表述。 3分：包含景点介绍。 5分：包含景点介绍以及周边美食推荐。
高级配置（可选）	背景知识	为执行提示词优化的模型补充特定领域的知识，模型可以选择是否将这些知识添加到提示词中，以提高任务的执行效果。取值范围：不大于1000的字符。	北京是中国的首都，也是历史文化名城，拥有丰富的风土人情和独特的城市魅力。以下是对北京风土人情的详细介绍：一、历史与文化北京有着三千多年的历史，曾是多个朝代的都城，如元、明、清等。这里是中国传统文化的重要发源地之一，拥有众多历史遗迹和文化景观，如故宫、天坛、颐和园等。北京的文化底蕴深厚，京剧、书法、篆刻、剪纸等传统艺术在这里得到了很好的传承和发展。二、饮食文化北京的饮食文化极具特色，代表性的美食有：北京烤鸭：以皮脆肉嫩、香气扑鼻而闻名，是北京的“名片”之一。炸酱面：地道的北京家常面食，酱香浓郁，配料丰富。豆汁儿：一种发酵的豆制品饮品，味道独特，是老北京人早餐的常见选择。卤煮火烧：一种以猪杂为主料的汤煮小吃，味道鲜美，深受本地人喜爱。

创建完成后，您可以在“开发中心 > 组件库 > 提示词”界面中的“优化任务”页签中查看创建的提示词优化任务。

任务运行成功后，状态将变为“优化成功”。单击操作列的“查看”进入详情页后，您不仅可以查看优化后的提示词，还可以对比优化前后提示词的目标准确率，以验证优化效果。目标准确率越高，表示模型输出越符合期望。

如果优化任务运行失败，状态将变为“优化失败”，您可以将鼠标悬停在“优化失败”上查看失败原因，或检查模型配置后重试。

图4 优化失败