在ModelArts Studio（MaaS）体验图像理解

当您需要快速理解图像内容时（如分析产品设计图、解读活动现场照片等），人工处理不仅耗时耗力，还存在细节遗漏和专业门槛等问题。MaaS提供图像理解功能，帮助您高效解决图像相关问题。

按Token计费：统计模型进行实时推理服务时消耗的Token数量，按Token数量付费，详情请参见ModelArts Studio（MaaS）图像理解模型计费。

一次只能发送一张图片，且必须携带文字。图片大小不能超过1MB，图片格式为jpg、jpeg、png或webp。

使用预置服务：在“在线推理 > 预置服务”页签，已开通图像理解模型的商用服务或者已创建图像理解模型的自定义接入点。具体操作，请参见在ModelArts Studio（MaaS）预置服务中开通商用服务和在ModelArts Studio（MaaS）预置服务中创建自定义接入点。
使用我的服务：在“在线推理 > 我的服务”页签，服务列表存在运行中、更新中或升级中的图像理解模型服务。具体操作，请参见使用ModelArts Studio（MaaS）部署模型服务。

（可选）在“图像理解”页面右上角，单击“参数设置”，按需拖动或直接输入数值配置推理参数。单击“恢复默认”可以将参数值调回默认值。

图1 设置推理参数

表1 参数设置
参数	说明
温度/Temperature	设置推理温度，用于控制生成文本的随机性和创造性，Temperature数值越大随机性越大。数值较低，输出结果更加集中和确定。数值较高，输出结果更加随机，更有创意性。取值范围：0~2 默认值：不同模型的默认值不同，请以实际环境为准。
核采样/top_p	设置推理核采样，用于调整输出文本的多样性。top_p数值越大，生成文本的多样性就越高。数值较低，输出可选的tokens类型越少，更有确定性。数值较高，输出可选的tokens类型越多，更有多样性。取值范围：0.1~1 默认值：不同模型的默认值不同，请以实际环境为准。详细解释：top_p可以设置tokens候选列表的大小，将可能性之和刚好超过设定值P的top tokens列入候选名单，然后从候选名单中随机采样，生成一个token。
top_k	用于控制输出tokens的多样性。top_k值越大输出的tokens类型越丰富。选择在模型的输出结果中选择概率最高的前K个结果。数值较低，输出可选的tokens类型越少，更有确定性。数值较高，输出可选的tokens类型越多，更有多样性。取值范围：1~1000 默认值：20 详细解释：top_k可以设置保留概率最高的前K个tokens，从中随机抽取一个token作为最终输出。这种方法可以限制输出序列的长度，并仍然保持样本的一定多样性。