更新时间:2024-09-03 GMT+08:00
分享

体验盘古预置模型能力

登录盘古大模型套件平台,在左侧导航栏中单击“能力调测”。

如图所示,能力调测页面提供了文本补全和多轮对话功能,且每种功能都提供了预置的盘古大模型供用户体验。用户可以在页面右侧进行参数设置,然后在输入框中输入问题,模型就会返回对应的答案内容,具体参数信息如下表。

图1 体验预置模型功能
表1 能力调测参数信息表

参数名称

描述

温度

控制语言模型输出的随机性与创造性。温度设置越低,输出更可预测;温度设置越高,输出种类更多,更不可预测。

核采样

控制生成文本多样性和质量。

最大口令限制

用于控制聊天回复的长度和质量。一般来说,设置较大的参数值可以生成较长和较完整的回复,但也可能增加生成无关或重复内容的风险。较小的参数值可以生成较短和较简洁的回复,但也可能导致生成不完整或不连贯的内容,请避免该值小于10,否则可能生成空值或极差的效果。因此,需要根据不同的场景和需求来选择合适的参数值。

话题重复度控制

用于调整模型对新令牌(Token)的处理方式。即如果一个Token已经在之前的文本出现过,那么模型在生成这个Token时会受到一定的惩罚。当值为正数时,模型会更倾向于生成新的Token,即更倾向于谈论新的话题。

词汇重复度控制

用于调整模型对频繁出现的Token的处理方式。即如果一个Token在训练集中出现的频率较高,那么模型在生成这个Token时会受到一定的惩罚。当的值为正数时,模型会更倾向于生成出现频率较低的Token,即模型会更倾向于使用不常见的词汇。

历史对话保留轮数

选择要包含在每个新API请求中的过去消息数。这有助于为新用户查询提供模型上下文。参数设置为10,表示包括5个用户查询和5个系统响应。该参数只涉及多轮对话功能。

  • 体验预置模型文本补全能力
    1. 进入“文本补全”页签,选择模型与示例,参数设置为默认参数,在输入框输入问题,单击“生成”,模型将基于问题进行回答。
      图2 体验预置模型文本补全能力
    2. 修改参数以查看模型效果,示例如下:
      1. 将“核采样”参数调小,如改为0.1,保持其他参数不变,单击“重新生成”,再单击“重新生成”,可以看到模型前后两次回复内容的多样性降低。
        图3 “核采样”参数调小后生成结果1
        图4 “核采样”参数调小后生成结果2
      2. 将“核采样”参数调大,如改为1,保持其他参数不变,单击“重新生成”,再单击“重新生成”,可以看到模型前后两次回复内容的多样性提高。
        图5 “核采样”参数调大后生成结果1
        图6 “核采样”参数调大后生成结果2
  • 体验预置模型的多轮对话能力
    1. 进入“多轮对话”页签,选择模型与人设,参数设置为默认参数,在输入框输入问题,单击“生成”,模型将基于问题进行回答。
      图7 体验预置模型多轮对话能力
    2. 修改参数以查看模型效果,示例如下:
      将“最大口令限制”参数调小,如改为98,保持其他参数不变,单击“重新生成”,可以看到模型回复内容长度减小。
      图8 修改“最大口令限制”参数

相关文档