调测平台预置的模型服务
模型调测是指通过对模型进行实际操作、参数调整及效果观测,以验证其在特定场景下的功能表现、性能指标及适用范围的过程,其核心目的是确保模型在真实业务场景中能够稳定、高效地运行。本章介绍平台接入的供应商模型调测流程。
调测模型服务
- 登录Versatile智能体平台,在左侧导航栏“个人空间”区域,选择进入所需空间。
如果已选择团队空间,界面显示为实际的团队空间名称,而非“个人空间”。
图1 选择团队空间 - 在左侧导航,选择“模型中心 > 模型服务”。
- 在“模型服务 > 平台预置”页面,单击对应的模型供应商卡片。
- 在“供应商详情”页面,在需要调测的模型服务卡片上,单击“
> 调测”。
- 在“模型调测”页面,可以调测如下几种类型的模型服务。
- 文本对话
- 在“模型类型”区域选择“文本对话”,参数配置请参考表1。
表1 文本对话类型模型参数说明 参数
说明
示例
模型服务
默认展示所选的供应商模型服务。
您也可以在下拉列表切换以下模型服务:
- 模型服务商API:平台接入的供应商模型服务。
- 我的模型API:用户自主接入的模型服务、用户自主部署的模型服务。
- 我的路由策略:用户自定义创建的路由策略。
DeepSeek-V3-32K
输出方式
- 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。
- 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。
流式
输出最大token数
模型在单次推理或生成内容时,能够输出的token(模型处理文本的基本单位)数量的最大值。取值范围为100~32768,默认值为2048。
2048
温度
较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。建议该参数和“多样性”只设置1个。默认值为0.5。
0.5
多样性
影响输出文本的多样性,取值越大,生成文本的多样性越强。建议该参数和“温度”只设置1个。默认值为0.5。
0.5
存在惩罚
介于-2.0和2.0之间的数字。正值会尽量避免使用已出现过的词语,更倾向于生成新词语。默认值为0。
0
频率惩罚
介于-2.0和2.0之间的数字。正值会尽量避免使用常见的单词和短语,更倾向于生成较少见的单词。默认值为0。
0
- 在右侧“效果预览”区域,在对话输入框输入测试语句后按Enter键或单击
,查看模型响应结果。
- 在“模型类型”区域选择“文本对话”,参数配置请参考表1。
- 图像理解
- 在“模型类型”区域选择“图像理解”,参数配置请参考表2。
表2 图像理解类型模型参数说明 参数
说明
示例
模型服务
默认展示所选的供应商模型服务。
您也可以在下拉列表切换以下模型服务:
- 模型服务商API:系统接入的供应商模型服务。
- 我的模型API:用户自主接入的模型服务。
Qwen-VL-Max
输出方式
- 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。
- 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。
流式
上传图片
单击
,可上传本地图片。支持上传JPG、PNG格式图片,且不大于4MB。
-
提示语内容
输入提示语,对图片进行提问。
图片里有什么?
- 单击“生成图像理解”,在右侧“效果预览”区域查看模型响应效果。
- 在“模型类型”区域选择“图像理解”,参数配置请参考表2。
- 文本向量化
- 在“模型类型”区域选择“文本向量化”,参数配置请参考表3。
- 单击“生成向量化”,在右侧“效果预览”区域查看模型响应效果。
- 文本对话