创建并发布Agent
Agent指具备自主智能的AI实体应用,具有一定的智能和自主性,可以自主地发现问题、设定目标、构思策略、执行任务等。
平台在资产中心预置了部分AI应用,同时也支持用户创建Agent,当前支持创建LLM模式和工作流模式两种类型的Agent。
- LLM模式下,将准备好的模型服务、工具、工作流、知识库等编排成Agent,用户与大模型进行对话,由大模型决策并灵活调用工作流、知识库等,同时,该模式还支持使用平台自带的智能创建功能快速搭建应用。
- 工作流模式下,不支持添加工具、知识库等配置,用户与工作流进行对话,每次对话都会调用该工作流,这种模式一般适用于相对固定的场景,例如客户服务热线,Agent在接收到用户输入后,按照既定的流程响应处理,不需要进行复杂的分析和决策。
前提条件
需要具备AI原生应用引擎管理员或开发者权限,权限申请操作请参见AppStage组织成员申请权限。
创建Agent(LLM模式)
- 在AI原生应用引擎的左侧导航栏选择“Agent编排中心 > 我的Agent”,单击“创建Agent”。
- 默认弹出“Agent生成”对话框,可选择以下任一方式生成Agent应用。
- 方式一:由系统智能生成Agent,具体操作如下:
- 在“Agent生成”对话框,根据页面参数配置引导,在“Agent名称”输入框输入想要的Agent名称,在“想要的Agent”输入框中描述想要的Agent的功能或用途等信息。
- 单击“生成”,系统将智能生成Agent配置及Agent。
- 方式二:配置Agent相关参数信息,生成Agent,具体操作如下:
- 关闭“Agent生成”对话框,在“创建Agent”页面左上角选择“LLM模式(智能创建)”,参照表1配置基础信息、选择模型及设定角色。
表1 创建Agent参数说明 参数名称
参数说明
基础信息
设置Agent名称、描述信息。
您也可以先输入应用功能描述等信息,单击后智能生成基础信息。
模型选择
- 方式一:单击,在弹框中设置如下参数,选择思考模型和问答模型。
思考模型用于任务规划和选择组件,问答模型用于总结生成回复结果。您可以结合资产中心大模型详情介绍进行模型选择和使用。
- 输出最大token数:简称max_tokens,表示模型输出最大token数。
- 温度:简称temperature,较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”(top_p)只设置1个。
- 多样性:简称top_p,影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”(temperature)只设置1个。
- 存在惩罚:简称presence_penalty,介于-2.0和2.0之间的数字。正值会尽量避免重复已经使用过的词语,更倾向于生成新词语。
- 频率惩罚:简称frequency_penalty,介于-2.0和2.0之间的数字。正值会尽量避免使用常见的单词和短语,更倾向于生成较少见的单词。
- 方式二:单击由系统智能生成模型。
说明:- 如果选择的模型服务商API在创建时设置了鉴权信息,在调用前需要配置认证鉴权,具体介绍请参见如何对模型供应商提供的模型服务设置鉴权。
- 如果要选择“我接入的”模型API作为思考模型,需要在模型服务描述中填写“SupportFunctionCall,AdaptFunctionCall”进行适配,具体介绍请参见接入模型服务。
角色设定
输入希望角色完成的任务目标、具备的组件能力以及对输出答案的要求与限制等。
示例:
#角色设定
作为一个电影剧本创作助手,你的任务是协助编剧创作电影剧本,提供创作灵感和故事构思。
#组件能力
你具备智能生成电影剧本、提供创作灵感和故事构思的能力。
#要求与限制
1. 输出内容的风格要求符合电影剧本的风格,具有吸引力和想象力。
2. 输出结果的格式需按照电影剧本的标准格式进行,包括场景描述、对话、动作等。
3. 输出内容的字数限制不超过5000字。
- 方式一:单击,在弹框中设置如下参数,选择思考模型和问答模型。
- 参照表2可拓展性地添加技能、知识库、开场白以及输入推荐问题。
表2 拓展性能力参数说明 参数名称
参数说明
技能
工具
用于实现特定功能的模块或组件,添加工具可以使Agent具备更多能力。
单击在“添加工具”对话框选择我创建的工具或系统预置的通用工具;单击由系统智能生成工具。
说明:如果系统预置的三方工具在创建时设置了鉴权信息,在调用前需要配置认证鉴权,具体介绍请参见调用资产中心工具前设置认证鉴权。
工作流
即一系列有序执行的工具,完成复杂任务的过程,添加工作流可以提高任务处理的效率和灵活性。
单击在“添加工作流”对话框选择我创建的工作流,配置工作流模式。- 总结模式:对工作流输出内容进行一定程度的概括或简化。
- 精确模式:直接返回工作流内容。
说明:调用工作流时,如果提示所选的工作流中存在当前Agent没有的变量,是由于在工作流节点中添加了变量,需要以Agent中名称相同的变量值作为工作流的参数输入,但Agent中没有设置这些变量。请单击“查看详情”,在补充变量弹窗中,单击“补充所选变量”,在Agent中添加变量。
知识
自动调用
知识库和知识检索流的调用方式。
- 自动调用:每一轮对话自动调用知识库,利用知识库召回内容辅助大模型生成回复内容。
- 按需调用:根据需要调用知识库,利用知识库召回内容辅助大模型生成回复内容。
- 最大召回数量:从检索结果中返回的内容片段数量,取值范围:0~10。
- 最小匹配度:知识库召回内容与检索需求匹配程度的最低阈值,用于确保召回内容具有一定的相关性,取值范围:0~1。
- 提示语内容:当调用方式为“自动调用”时,支持配置此参数。将用户问题和知识库检索的内容通过提示语形式进行组装,提供给大模型,有助于大模型提供准确回答。
输入的提示语内容必须包含{{context}}和{{query}},{{context}}为知识库检索的内容,{{query}}为用户问题,提示语内容通过{{context}}和{{query}}对知识库数据进行自定义调用。
提示语内容输入范例:A问B{{query}},B回答了{{context}}。
假如知识库数据中context为月亮,query为李白的静夜思主题是什么?那提示语就能对该数据进行调用,得出:
A问B李白的静夜思主题是什么?
B回答了月亮。
知识库
单击,在“添加知识库”对话框中的下拉列表选择现有知识库,单击“确认”;单击由系统智能生成知识库。
知识检索流
知识检索流作为知识库检索工具,基于意图识别、Query改写、Query拆解、召回和重排序等,支持可视化RAG检索编排,可以提升检索过程的灵活度与检索结果的质量。
单击,在“知识检索流”弹框中选择知识检索流。
记忆
变量
变量用来存储用户的某一行为或偏好,在对话过程中,会自动识别与变量匹配的内容,并存储在变量中。
- 单击“变量”参数后面的,弹出“编辑变量”页面。
- 单击“添加一般变量”,输入字段名、默认值、描述。例如:字段名为“职业”,默认值为“医生”。
一般变量可作为记忆信息存储,有助于Agent生成个性化回答,同时也可以作为工作流的输入参数。
- 单击“添加敏感变量”,输入字段名、描述。
敏感变量仅支持作为工作流的输入参数,不会用于个性化回答。
- 单击“保存”。
说明:单击“变量”参数后面的,可以查看、编辑变量最新值。
片段记忆
开启片段记忆开关,Agent可以形成对用户的个人记忆,提供个性化回复。
勾选“支持自动整合更新”,可以对片段记忆存储的信息进行自动整合和优化更新。
文件盒子
开启文件盒子开关,Agent可以自动使用API保存和管理用户文件。
在Agent体验或使用过程中,可以利用模型能力对上传的文件进行解读。
对话设置
开场白
可通过两种方式进行设置:
推荐问题
可通过两种方式进行设置:
- 单击,在输入框输入推荐的问题语句。
- 单击由系统智能生成推荐的问题语句。
语音设置
- 支持语音输入:开启后,支持使用语音输入问题。
- 支持语音输出:开启后,Agent以语音形式输出回答。
- 关闭“Agent生成”对话框,在“创建Agent”页面左上角选择“LLM模式(智能创建)”,参照表1配置基础信息、选择模型及设定角色。
- 方式一:由系统智能生成Agent,具体操作如下:
- 在“Agent预览”区域单击“开始体验”,在对话输入框输入问题,按Enter键或单击预览Agent效果。
- 单击对话输入框中的,上传.wav、.mp4、.mp3格式的文件,可以对上传的音频文件提问。
- 如果Agent开启了“支持语音输入”开关,您也可以单击对话输入框中的,通过语音输入问题。
- 如果Agent使用配置变量的方式实现了记忆能力,在预览时,会自动识别对话与变量匹配的内容,自动更新变量取值,单击“变量”参数后面的,可以查看变量使用效果,修改变量取值可以手动更新Agent记忆信息。
- 如果Agent开启了“片段记忆”开关,在预览时,会自动识别并保留用户个性化信息,单击“片段记忆”参数后面的,可以查看片段记忆使用效果,单击记忆内容后面的,修改记忆内容,可以手动更新Agent记忆信息。
- 如果Agent开启了文件盒子,执行如下操作进行体验:
- 单击文件盒子区域的,上传文件。
只支持pdf、docx、txt等纯文本文件,文件大小小于10M。
- 文件上传完成后,在“编辑文件盒子”弹窗中,单击文件列表操作列的。
- 在对话输入框对引用文件提问,Agent会根据输入问题对引用文件进行回答、解读。
- 单击文件盒子区域的,上传文件。
- 单击“保存”,完成Agent创建。
“我创建的”列表中生成一条Agent记录,Agent状态为“草稿”。
创建Agent(工作流模式)
- 在AI原生应用引擎的左侧导航栏选择“Agent编排中心 > 我的Agent”。
- 单击“创建Agent”,在页面左上角选择“工作流模式”。
- 在“创建Agent”页面,参照表3配置参数。
表3 创建Agent参数说明 参数名称
参数说明
基础信息
设置Agent名称、描述信息。
工作流配置
单击,在“添加工作流”弹窗中选择我创建的工作流。您也可以单击“创建工作流”,参考创建工作流创建新的工作流。
工作流模式的Agent只能绑定一个工作流,且此工作流的起始节点必须包含默认的WISEAGENT_USER_INPUT参数,表示用户在问答对话中输入的内容,与Agent的每次对话都会对该工作流进行调用。
WISEAGENT_VARIABLES和WISEAGENT_CONVERSATION为可选参数。
变量
变量用来存储用户的某一行为或偏好,在对话过程中,会自动识别与变量匹配的内容,并存储在变量中。- 单击“变量”参数后面的,弹出“编辑变量”页面。
- 单击“添加一般变量”,输入字段名、默认值、描述。例如:字段名为“职业”,默认值为“医生”。
一般变量可作为记忆信息存储,有助于Agent生成个性化回答,同时也可以作为工作流的输入参数。
- 单击“添加敏感变量”,输入字段名、描述。
敏感变量仅支持作为工作流的输入参数,不会用于个性化回答。
- 单击“保存”。
说明:单击“变量”参数后面的,可以查看、编辑变量最新值。
开场白
在输入框自定义设置开场白语句。
示例:你好,我是差旅助手!我能为你规划行程、提供实时交通信息,助你出行无忧。请问有什么关于出行的问题我可以帮助你解答?
推荐问题
单击,在输入框输入推荐的问题语句。
语音设置
- 支持语音输入:开启后,支持使用语音输入问题。
- 支持语音输出:开启后,Agent以语音形式输出回答。
- 在“Agent预览”区域单击“开始体验”,在对话输入框输入问题,按Enter键或单击预览Agent效果。
- 单击对话输入框中的,上传.wav、.mp4、.mp3格式的文件,可以对上传的音频文件提问。
- 如果Agent开启了“支持语音输入”开关,您也可以单击对话输入框中的,通过语音输入问题。
- 如果Agent使用配置变量的方式实现了记忆能力,在预览时,会自动识别对话与变量匹配的内容,自动更新变量取值,单击“变量”参数后面的,可以查看变量使用效果,修改变量取值可以手动更新Agent记忆信息。
- 单击“保存”,完成Agent创建。
“我创建的”列表中生成一条Agent记录,Agent状态为“草稿”。
发布Agent
发布Agent前需要订购智能应用运行时引擎资源,订购方法请参见购买AI原生应用引擎。
Agent发布后,用户即可通过API接口调用或Web界面进行访问。
- Agent创建完成后,在创建页面单击“发布”。
也可以在“我创建的”列表中,单击Agent列表操作列的“发布Agent”,进入发布页面。
- 选择发布渠道并设置发布密钥,单击“发布”。
表4 发布参数说明 参数
说明
选择发布渠道
- API:以API的方式发布Agent,发布成功后可复制API地址进行分享。
- Web UrI:以Web Url的方式发布Agent,发布成功后可复制Web链接进行分享。
设置发布密钥
设置该密钥是确保发布分享Agent后,用户能正常调用Agent相关联的模型、工具、工作流和知识库。
API Key:输入API Key。
说明:仅AI原生应用引擎管理员角色可以创建API Key,请通过管理员获取API Key。
- 发布后,在Agent列表的“复制发布地址”列,单击或,复制发布地址进行分享。
更多操作
Agent创建完成后,可执行如表5所示操作。
操作 |
说明 |
---|---|
查看Agent详情 |
在“我的Agent > 我创建的”页面的应用列表中单击Agent名称,进入Agent详情页面,可查看Agent的基础信息、Agent组成、接口信息以及对话日志等。 |
修改Agent参数 |
支持修改状态为“草稿”的Agent。 在“我的Agent > 我创建的”页面的应用列表中的“操作”列,选择“更多 > 修改”,修改Agent配置参数。 |
取消发布Agent |
|
删除Agent |
对于已发布的Agent,可先取消发布再删除。
|
体验Agent |
我创建的Agent发布后,可以进行体验,具体介绍请参见体验Agent。 |