选择并配置模型

在Versatile中，创建智能体后配置模型是构建和优化智能应用的关键操作，用户可以通过可视化配置页面选择和集成多种大语言模型，如盘古、DeepSeek、千问等。通过灵活选择和配置不同大语言模型，确保智能体能够根据业务需求高效、稳定地提供强大的AI能力。

前提条件

Versatile已接入模型。接入模型服务详见接入模型服务。

选择模型

您可以在智能体的编排页面为智能体选择一个合适的大模型。选择模型并完成智能体的技能、知识等设置后，你也可以切换成不同的模型，测评各个模型在同一个智能体中的效果，选择最合适的模型。

登录Versatile智能体平台，在左侧导航栏“个人空间”区域，选择目标空间。
在左侧导航栏中选择“开发中心 > 应用管理 > 单智能体应用”。
在“单智能体应用”页面选择已创建的单智能体。
在智能体页面右上角，单击模型模块下拉框，选择模型。

图1 选择模型
模型的标签展示顺序从左到右依次是用户自定义标签、接入模型时的“选择标签”、“模型类型”。
- 接入模型时的“选择标签”：
  - 联网：表示该大模型具备联网搜索能力。
  - 思考：表示该大模型具备思维推理能力。
  - 工具：表示该大模型支持应用调用外部工具，例如，MCP服务、插件、知识库等。
  - default-import：表示该大模型是系统默认模型。
  - 免费：表示该平台预置大模型可免费使用。
  - 体验：表示该平台预置大模型可以体验，会话轮数最大为20次。
- “模型类型”包含：
  - 文本：表示该大模型是文本对话类型。
  - 视觉：表示该大模型是图像理解类型。
  - 嵌入：表示该大模型是文本向量化类型。
  - 排序：表示该大模型是文本排序类型。
- 模型状态：
  - 未验证：表示该大模型未检验鉴权信息，不可使用。
  - 成功：表示该大模型鉴权信息校验成功，可以使用。
  - 失败：表示该大模型鉴权信息校验失败，不可使用。

调整模型生成倾向

可以从多个维度调整不同模型在生成内容时的随机性和多样性。平台提供以下预置的模式供您选择，每个模式的模型参数取值不同。

精确的：严格遵循指令要求生成内容，适合正式文档、代码等。
平衡的：模型生成内容处于严谨和创意的平衡，适合大多数场景。
创意性的：生成内容偏向创意独特，适合头脑风暴、创作场景。
自定义：你也可以根据需求，选择“自定义设置”，修改每个模式下的具体参数值。建议不要同时调整生成温度和核采样，以免在多参数的影响下难以判断每个参数的调整效果。

表1 调整模型生成倾向参数
配置项	说明
温度	单击“模式选择”后的下拉箭头可展示温度参数。即temperature，用于控制结果的随机性。调高温度会使得模型的输出更多样性和创新性，反之，降低温度会使输出内容更加遵循指令要求但减少多样性。建议不要与核采样同时调整。
核采样	单击“模式选择”后的下拉箭头可展示核采样参数。模型在输出时会从概率最高的词汇开始选择，直到这些词汇的总概率累积达到核采样值，这样可以限制模型选择这些高概率的词汇，从而控制输出内容的多样性。建议不要与温度同时调整。
深度思考	显示该参数有以下两个场景：平台推荐：当选择的模型服务为思考模型且支持关闭深度思考时，才显示此参数，例如平台推荐的Qwen3-32B-32K、DeepSeek-V3.2-Exp。用户自主接入的模型服务：当选择的模型服务为思考模型且在新建模型服务开启了“是否支持关闭思维链输出”时，才显示此参数。该参数支持以下操作：当此功能开启时，大模型将首先进行深入的思考和推理，通过逐步拆解问题、梳理逻辑，生成一段详细的思维链内容，并在调试界面展示。这一过程有助于提升最终输出答案的准确性和可靠性，确保用户获得更加精准的信息。当此功能关闭时，智能体将直接生成最终答案，不再经过额外的思维链推理过程。这将加快响应速度，适用于需要快速获取答案的场景。注意：在模型使用过程中，“深度思考”开关生效的情况如下：如果模型支持思维链输出能力，并且也支持关闭该能力，则开启、关闭均生效。如果模型支持思维链输出能力，但不支持关闭该能力，则开启生效、关闭不生效。如果模型不支持思维链输出能力，则开启、关闭均不生效。
历史对话轮数	设置带入模型上下文的对话历史轮数，轮数越多相关性越高。参数取值1~20。
最大回复长度	用于控制聊天回复的长度和质量。一般来说，最大回复长度值设置较大，生成较长和较完整的回复，同时会增加生成无关或重复内容的风险。较小的最大回复长度值可以生成较短和较简洁的回复，但可能导致生成不完整或不连贯的内容。因此，需要根据不同的场景和需求来选择合适的最大回复长度值。
重复语句惩罚	用于阻止模型频繁使用相同的词汇和短语，取值范围为-2~2。当该值为正数时，会阻止模型频繁使用相同的词汇和短语，从而增加输出内容的多样性。当该值为负数时，模型会频繁使用相同的词汇和短语，如训练数据中频繁出现的词。
模型高级配置	当配置智能体调度模式选择为“工具优先”时，可配置“模型高级配置”。合一：将规划模型与问答模型的配置整合，通过共享参数和优化算法，实现高效统一的多任务处理能力。独立：规划模型与问答模型可独立配置，两者均支持模式配置、温度、核采样、历史对话轮数、最大回复长度设置，此外，问答模型还支持重复语句惩罚功能。说明：规划模型和问答模型可以设置为同一模型，也可分别设置为不同模型，用户可根据具体需求设定。