更新时间:2026-01-16 GMT+08:00
分享

选择并配置模型

在Versatile中,创建智能体后配置模型是构建和优化智能应用的关键操作,用户可以通过可视化配置页面选择和集成多种大语言模型,如盘古、DeepSeek、千问等。通过灵活选择和配置不同大语言模型,确保智能体能够根据业务需求高效、稳定地提供强大的AI能力。

前提条件

Versatile已接入模型。接入模型服务详见接入模型服务

选择模型

您可以在智能体的编排页面为智能体选择一个合适的大模型。选择模型并完成智能体的技能、知识等设置后,你也可以切换成不同的模型,测评各个模型在同一个智能体中的效果,选择最合适的模型。

  1. 登录Versatile智能体平台,在左侧导航栏“个人空间”区域,选择目标空间。
  2. 在左侧导航栏中选择开发中心 > 应用管理 > 单智能体应用
  3. “单智能体应用”页面选择已创建的单智能体。
  4. 在智能体页面右上角,单击模型模块下拉框,选择模型。

    图1 选择模型

    模型的标签展示顺序从左到右依次是用户自定义标签、接入模型时的“选择标签”“模型类型”

    • 接入模型时的“选择标签”
      • 联网:表示该大模型具备联网搜索能力。
      • 思考:表示该大模型具备思维推理能力。
      • 工具:表示该大模型支持应用调用外部工具,例如,MCP服务、插件、知识库等。
      • default-import:表示该大模型是系统默认模型。
      • 免费:表示该平台预置大模型可免费使用。
      • 体验:表示该平台预置大模型可以体验,会话轮数最大为20次。
    • “模型类型”包含:
      • 文本:表示该大模型是文本对话类型。
      • 视觉:表示该大模型是图像理解类型。
      • 嵌入:表示该大模型是文本向量化类型。
      • 排序:表示该大模型是文本排序类型。
    • 模型状态:
      • 未验证:表示该大模型未检验鉴权信息,不可使用。
      • 成功:表示该大模型鉴权信息校验成功,可以使用。
      • 失败:表示该大模型鉴权信息校验失败,不可使用。

调整模型生成倾向

可以从多个维度调整不同模型在生成内容时的随机性和多样性。平台提供以下预置的模式供您选择,每个模式的模型参数取值不同。

  • 精确的:严格遵循指令要求生成内容,适合正式文档、代码等。
  • 平衡的:模型生成内容处于严谨和创意的平衡,适合大多数场景。
  • 创意性的:生成内容偏向创意独特,适合头脑风暴、创作场景。
  • 自定义:你也可以根据需求,选择“自定义设置”,修改每个模式下的具体参数值。建议不要同时调整生成温度和核采样,以免在多参数的影响下难以判断每个参数的调整效果。
表1 调整模型生成倾向参数

配置项

说明

温度

单击“模式选择”后的下拉箭头可展示温度参数。

即temperature,用于控制结果的随机性。 调高温度会使得模型的输出更多样性和创新性,反之,降低温度会使输出内容更加遵循指令要求但减少多样性。建议不要与核采样同时调整。

核采样

单击“模式选择”后的下拉箭头可展示核采样参数。

模型在输出时会从概率最高的词汇开始选择,直到这些词汇的总概率累积达到核采样值,这样可以限制模型选择这些高概率的词汇,从而控制输出内容的多样性。建议不要与温度同时调整。

深度思考

显示该参数有以下两个场景:

  • 平台推荐:当选择的模型服务为思考模型且支持关闭深度思考时,才显示此参数,例如平台推荐的Qwen3-32B-32K、DeepSeek-V3.2-Exp。
  • 用户自主接入的模型服务:当选择的模型服务为思考模型且在新建模型服务开启了“是否支持关闭思维链输出”时,才显示此参数。

该参数支持以下操作:

  • 当此功能开启时,大模型将首先进行深入的思考和推理,通过逐步拆解问题、梳理逻辑,生成一段详细的思维链内容,并在调试界面展示。这一过程有助于提升最终输出答案的准确性和可靠性,确保用户获得更加精准的信息。
  • 当此功能关闭时,智能体将直接生成最终答案,不再经过额外的思维链推理过程。这将加快响应速度,适用于需要快速获取答案的场景。
注意:
在模型使用过程中,“深度思考”开关生效的情况如下:
  • 如果模型支持思维链输出能力,并且也支持关闭该能力,则开启、关闭均生效。
  • 如果模型支持思维链输出能力,但不支持关闭该能力,则开启生效、关闭不生效。
  • 如果模型不支持思维链输出能力,则开启、关闭均不生效。

历史对话轮数

设置带入模型上下文的对话历史轮数,轮数越多相关性越高。参数取值1~20。

最大回复长度

用于控制聊天回复的长度和质量。一般来说,最大回复长度值设置较大,生成较长和较完整的回复,同时会增加生成无关或重复内容的风险。较小的最大回复长度值可以生成较短和较简洁的回复,但可能导致生成不完整或不连贯的内容。因此,需要根据不同的场景和需求来选择合适的最大回复长度值。

重复语句惩罚

用于阻止模型频繁使用相同的词汇和短语,取值范围为-2~2。
  • 当该值为正数时,会阻止模型频繁使用相同的词汇和短语,从而增加输出内容的多样性。
  • 当该值为负数时,模型会频繁使用相同的词汇和短语,如训练数据中频繁出现的词。

模型高级配置

当配置智能体调度模式选择为“工具优先”时,可配置“模型高级配置”
  • 合一:将规划模型与问答模型的配置整合,通过共享参数和优化算法,实现高效统一的多任务处理能力。
  • 独立:规划模型与问答模型可独立配置,两者均支持模式配置、温度、核采样、历史对话轮数、最大回复长度设置,此外,问答模型还支持重复语句惩罚功能。
    说明:

    规划模型和问答模型可以设置为同一模型,也可分别设置为不同模型,用户可根据具体需求设定。

相关文档