更新时间:2026-03-23 GMT+08:00
分享

使用“体验中心”调用CV大模型

体验中心功能支持用户调用预置或训练后的CV大模型。使用该功能前,请完成模型的部署操作,步骤详见创建CV大模型训练任务

使用“体验中心”调用CV大模型可实现确认感兴趣的目标所在的位置和类别。具体步骤如下:

  1. 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。
    图1 我的空间
  2. 在左侧导航栏中选择“体验中心”,单击“视觉感知”页签。
  3. 调用“开集检测”模型。

    上传图片和自定义的标签列表,模型识别出图片中该类别所在的位置,会返回带有标签的检测框信息和画好框的图片。

    1. 选择要调用的开集检测模型。可从“预置服务”或“我的服务”中选择。
    2. 可以使用推荐样例图,也可上传自己的图片。
    3. 填写提示词。使用推荐样例图会给出默认提示词,使用自己的图片。

      英文提示词效果更佳,提示词之间以分隔号分隔(/)。

    4. 设置置信度。

      设置目标检测结果的阈值过滤,目标检测结果score低于该值的结果会被过滤。

    5. 单击“开始检测”,即可在界面右侧看到输出的结果。
      图2 检测结果
  4. 调用“视觉交互检测”模型。
    通过文本或者视觉提示来找出目标图像中所有感兴趣的目标,确定它们的位置和类别。
    1. 选择要调用的视觉交互检测模型。可从“预置服务”或“我的服务”中选择。
    2. 可以使用推荐样例图,也可上传自己的图片。
    3. 框选目标。

      框选:

      • 建议提示图像最多10个。
      • 文本提示 :'.'分隔类别,例如'cat.dog.'表示提示 cat和dog两个类别。建议提示类别不超过50个。

      选择:

      全部清除:

      删除图片:

    4. 设置置信度。

      设置目标检测结果的阈值过滤,目标检测结果score低于该值的结果会被过滤。

    5. 单击“开始检测”,即可在界面右侧看到输出的结果。
      图3 检测结果

相关文档