调测预置的模型服务
模型调测是指通过对模型进行实际操作、参数调整及效果观测,以验证其在特定场景下的功能表现、性能指标及适用范围的过程,其核心目的是确保模型在真实业务场景中能够稳定、高效地运行。本章介绍平台接入的供应商模型调测流程。目前平台预置了ModelArts Studio (MaaS)供应商的模型服务,目前支持的模型类型为文本对话、图像理解、文本向量化、文本排序。
前提条件
- 已购买Versatile智能体平台。
- 已对预置的供应商模型服务设置鉴权。
- 登录用户为空间所有者、空间管理员、开发工程师、运维工程师,详细信息请参考管理团队空间成员。
调测模型服务
- 登录Versatile智能体平台,在左侧导航栏“个人空间”区域,选择目标空间。
- 在左侧导航,选择“模型中心 > 模型服务”。
- 在“模型服务 > 平台推荐”页面,在模型服务卡片上,单击“调测”。
图1 调测
- 在“模型调测”页面,可以调测如下几种类型的模型服务。
- 文本对话
- 在“模型类型”区域选择“文本对话”,参数配置请参考表1。
图2 文本对话
表1 文本对话类型模型参数说明 参数
说明
示例
模型服务
“模型服务A”默认展示所选的供应商模型服务。“模型服务B”为可选项。
您也可以在下拉列表选择或切换以下模型服务:
- 用户自主接入的模型服务:以模型供应商维度展示。
- 平台推荐:以模型供应商维度展示。
- 路由策略:用户自定义创建的路由策略。
DeepSeek-V3
深度思考
显示该参数有以下两个场景:
- 平台推荐:当选择的模型服务为思考模型且支持关闭深度思考时,才显示此参数,例如平台推荐的Qwen3-32B、DeepSeek-V3.2。
- 用户自主接入的模型服务:当选择的模型服务为思考模型且在新建模型服务开启了“是否支持关闭思维链输出”时,才显示此参数。
该参数支持以下操作:
- 当此功能开启时,大模型将首先进行深入的思考和推理,通过逐步拆解问题、梳理逻辑,生成一段详细的思维链内容,并在调试界面展示。这一过程有助于提升最终输出答案的准确性和可靠性,确保用户获得更加精准的信息。
- 当此功能关闭时,智能体将直接生成最终答案,不再经过额外的思维链推理过程。这将加快响应速度,适用于需要快速获取答案的场景。
注意:在模型使用过程中,“深度思考”开关生效的情况如下:- 如果模型支持思维链输出能力,并且也支持关闭该能力,则开启、关闭均生效。
- 如果模型支持思维链输出能力,但不支持关闭该能力,则开启生效、关闭不生效。
- 如果模型不支持思维链输出能力,则开启、关闭均不生效。
开启
输出方式
- 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。
- 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。默认流式。
流式
输出最大token数
模型在单次推理或生成内容时,能够输出的token(模型处理文本的基本单位)数量的最大值。取值范围100~32768,默认值为2048。
2048
温度
较高的数值会使输出更加随机,而较低的数值会使其更加集中和确定。取值范围0.01~2,默认值为0.5。
建议该参数和“多样性”只设置1个。
0.5
多样性
影响输出文本的多样性,取值越大,生成文本的多样性越强。取值范围0~1,默认值为0.5。
建议该参数和“温度”只设置1个。
0.5
存在惩罚
正值会尽量避免使用已出现过的词语,更倾向于生成新词语。取值范围-2.0~2.0,默认值为0。
0
频率惩罚
正值会尽量避免使用常见的单词和短语,更倾向于生成较少见的单词。取值范围-2.0~2.0,默认值为0。
0
- 在“模型类型”区域选择“文本对话”,参数配置请参考表1。
- 图像理解
- 在“模型类型”区域选择“图像理解”,参数配置请参考表2。
图4 图像理解
表2 图像理解类型模型参数说明 参数
说明
示例
模型服务
默认展示所选的供应商模型服务。
您也可以在下拉列表切换以下模型服务:
- 用户自主接入的模型服务:以模型供应商维度展示。
- 平台推荐:以模型供应商维度展示。
Qwen2.5-VL-72B
输出方式
- 非流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,大语言模型完整生成回答后一次性返回。默认非流式。
- 流式:调用大语言模型推理服务时,根据用户问题,获取大语言模型的回答,逐个字词的快速返回模式,不需等待大语言模型生成完成。
非流式
上传图片
单击
,可上传本地图片。支持上传JPG、PNG格式图片,且不大于4MB。-
提示语内容
输入提示语,对图片进行提问。
图片里有什么?
- 单击“生成图像理解”,在右侧“效果预览”区域查看模型响应效果。
调测成功后,可以在智能体、工作流中使用模型服务,请参考开发单智能体应用、开发工作流应用、开发多智能体应用。
图5 图像理解模型调测成功
- 在“模型类型”区域选择“图像理解”,参数配置请参考表2。
- 文本向量化
- 文本排序
- 文本对话







