调测预置的模型服务

模型调测是指通过对模型进行实际操作、参数调整及效果观测，以验证其在特定场景下的功能表现、性能指标及适用范围的过程，其核心目的是确保模型在真实业务场景中能够稳定、高效地运行。本章介绍平台接入的供应商模型调测流程。目前平台预置了ModelArts Studio (MaaS)供应商的模型服务，目前支持的模型类型为文本对话、图像理解、文本向量化、文本排序。

前提条件

已购买Versatile智能体平台。
已对预置的供应商模型服务设置鉴权。
登录用户为空间所有者、空间管理员、开发工程师、运维工程师，详细信息请参考管理团队空间成员。

调测模型服务

登录Versatile智能体平台，在左侧导航栏“个人空间”区域，选择目标空间。
在左侧导航，选择“模型中心 > 模型服务”。
在“模型服务 > 平台推荐”页面，在模型服务卡片上，单击“调测”。

图1 调测

在“模型调测”页面，可以调测如下几种类型的模型服务。

文本对话

在“模型类型”区域选择“文本对话”，参数配置请参考表1。

图2 文本对话

表1 文本对话类型模型参数说明
参数	说明	示例
模型服务	“模型服务A”默认展示所选的供应商模型服务。“模型服务B”为可选项。您也可以在下拉列表选择或切换以下模型服务：用户自主接入的模型服务：以模型供应商维度展示。平台推荐：以模型供应商维度展示。路由策略：用户自定义创建的路由策略。	DeepSeek-V3
深度思考	显示该参数有以下两个场景：平台推荐：当选择的模型服务为思考模型且支持关闭深度思考时，才显示此参数，例如平台推荐的Qwen3-32B、DeepSeek-V3.2。用户自主接入的模型服务：当选择的模型服务为思考模型且在新建模型服务开启了“是否支持关闭思维链输出”时，才显示此参数。该参数支持以下操作：当此功能开启时，大模型将首先进行深入的思考和推理，通过逐步拆解问题、梳理逻辑，生成一段详细的思维链内容，并在调试界面展示。这一过程有助于提升最终输出答案的准确性和可靠性，确保用户获得更加精准的信息。当此功能关闭时，智能体将直接生成最终答案，不再经过额外的思维链推理过程。这将加快响应速度，适用于需要快速获取答案的场景。注意：在模型使用过程中，“深度思考”开关生效的情况如下：如果模型支持思维链输出能力，并且也支持关闭该能力，则开启、关闭均生效。如果模型支持思维链输出能力，但不支持关闭该能力，则开启生效、关闭不生效。如果模型不支持思维链输出能力，则开启、关闭均不生效。	开启
输出方式	非流式：调用大语言模型推理服务时，根据用户问题，获取大语言模型的回答，大语言模型完整生成回答后一次性返回。流式：调用大语言模型推理服务时，根据用户问题，获取大语言模型的回答，逐个字词的快速返回模式，不需等待大语言模型生成完成。默认流式。	流式
输出最大token数	模型在单次推理或生成内容时，能够输出的token（模型处理文本的基本单位）数量的最大值。取值范围100~32768，默认值为2048。	2048
温度	较高的数值会使输出更加随机，而较低的数值会使其更加集中和确定。取值范围0.01~2，默认值为0.5。建议该参数和“多样性”只设置1个。	0.5
多样性	影响输出文本的多样性，取值越大，生成文本的多样性越强。取值范围0~1，默认值为0.5。建议该参数和“温度”只设置1个。	0.5
存在惩罚	正值会尽量避免使用已出现过的词语，更倾向于生成新词语。取值范围-2.0~2.0，默认值为0。	0
频率惩罚	正值会尽量避免使用常见的单词和短语，更倾向于生成较少见的单词。取值范围-2.0~2.0，默认值为0。	0

在右侧“效果预览”区域，在对话输入框输入测试语句后按Enter键或单击，查看模型响应结果。
单击，清除本次会话内容，可以开始新的会话。

调测成功后，可以在智能体、工作流中使用模型服务，请参考开发单智能体应用、开发工作流应用、开发多智能体应用。

图3 文本对话模型调测成功

图像理解

在“模型类型”区域选择“图像理解”，参数配置请参考表2。

图4 图像理解

表2 图像理解类型模型参数说明
参数	说明	示例
模型服务	默认展示所选的供应商模型服务。您也可以在下拉列表切换以下模型服务：用户自主接入的模型服务：以模型供应商维度展示。平台推荐：以模型供应商维度展示。	Qwen2.5-VL-72B
输出方式	非流式：调用大语言模型推理服务时，根据用户问题，获取大语言模型的回答，大语言模型完整生成回答后一次性返回。默认非流式。流式：调用大语言模型推理服务时，根据用户问题，获取大语言模型的回答，逐个字词的快速返回模式，不需等待大语言模型生成完成。	非流式
上传图片	单击，可上传本地图片。支持上传JPG、PNG格式图片，且不大于4MB。	-
提示语内容	输入提示语，对图片进行提问。	图片里有什么？

单击“生成图像理解”，在右侧“效果预览”区域查看模型响应效果。
调测成功后，可以在智能体、工作流中使用模型服务，请参考开发单智能体应用、开发工作流应用、开发多智能体应用。

图5 图像理解模型调测成功

文本向量化

在“模型类型”区域选择“文本向量化”，参数配置请参考表3。

图6 文本向量化

表3 文本向量化类型模型参数说明
参数	说明	示例
模型服务	默认展示所选的供应商模型服务。您也可以在下拉列表切换以下模型服务：用户自主接入的模型服务：以模型供应商维度展示。平台推荐，以模型供应商维度展示。	BGE-M3
请输入文本	输入待向量化的文本，可参照以下示例：示例1：那是个快乐的人示例2： ["那是个快乐的人", "那是个高兴的人", "那是个忧郁的人"]	那是个快乐的人

单击“生成向量化”，在右侧“效果预览”区域查看模型响应效果。
调测成功后，可以在智能体、工作流中使用模型服务，请参考开发单智能体应用、开发工作流应用、开发多智能体应用。

图7 文本向量化调测成功

文本排序

在“模型类型”区域选择“文本排序”，参数配置请参考表4。

图8 文本排序

表4 文本排序类型模型参数说明
参数名称	参数说明	示例
模型服务	默认展示所选的模型服务。您也可以在下拉列表切换以下模型服务：用户自主接入的模型服务：以模型供应商维度展示。平台推荐，以模型供应商维度展示。	BGE-Reranker-V2-M3
待排序文本	输入待排序文本。单击添加文本，最多可以添加10条。	小朋友在学校很快乐
被展示文本条数	文本排序完成后，展示的条数。取值范围为1~10，默认值为1。	3
我的问题	描述想要解决的问题。	小朋友在学校怎么样？