更新时间:2025-12-01 GMT+08:00
分享

Pangu-CV-万物检测-V2

功能介绍

该模型主要实现物体检测的功能,输入图片的base64码和自定义的标签列表,模型识别出图片中该类别所在的位置,会返回带有标签的检测框信息和画好框的图片base64编码。

服务调用方式:

  • 支持图片推理。
  • 图片推理支持在线和边缘部署。

授权信息

账号具备所有API的调用权限,如果使用账号下的IAM用户调用当前API,该IAM用户需具备调用API所需的权限,具体权限要求请参见权限和授权项

URI

POST /

获取URI方式请参见请求URI

请求参数

表1 请求Header参数(Token认证)

参数

是否必选

参数类型

描述

X-Auth-Token

是(云上部署模型填写)

String

参数解释:

用户Token。

用于获取操作API的权限。如图4中响应消息头中X-Subject-Token的值即为Token。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

Content-Type

String

参数解释:

发送的实体的MIME类型。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

参数值为“application/json”

表2 请求Header参数(API Key认证)

参数

是否必选

参数类型

描述

X-Apig-AppCode

是(云上部署模型填写、边缘部署模型仅在监控网关访问模式下填写)

String

参数解释:

API Key值。

用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

Content-Type

String

参数解释:

发送的实体的MIME类型。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

参数值为“application/json”

表3 请求Body参数

参数

是否必选

参数类型

描述

images

String

参数解释:

被检测图片的base64编码。

约束限制:

支持识别PNG、JPEG、BMP、JPG、WEBP格式的图片。只支持单张图片输入,分辨率范围为1px-10000px,base64编码后的图片大小不超过10MB,且长短边比例不能高于5。默认只支持RGB三通道图片数据,其他通道的数据暂不支持。

取值范围:

不涉及

默认取值:

不涉及

threshold

Float

参数解释:

检测框置信度的阈值。

约束限制:

不涉及

取值范围:

[0, 1]

默认取值:

不涉及

响应参数

状态码: 200

表4 响应Body参数

参数

参数类型

描述

result

MultimodalDINOResult object

参数解释:

检测结果信息。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

表5 MultimodalDINOResult

参数

参数类型

描述

Box

object

参数解释:

目标检测框坐标,[检测框左上角到竖轴距离,目标框左上角到横轴距离, 检测框宽度, 检测框高度],{"X": x, "Y": y, "Width": w, "Height": h}

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

Score

Float

参数解释:

目标检测置信度。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

label

String

参数解释:

目标标签。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

状态码: 400

表6 响应Body参数

参数

参数类型

描述

error_code

String

错误码。

error_msg

String

错误信息。

请求示例

{
    "threshold": 0.25,
    "images": "/9j/4AAQSkZJRgABAQAAAQABAAD/......"
}

响应示例

{
	"result": [
		{
			"Box": {
				"Y": 0,
				"Width": 100,
				"X": 0,
				"Height": 100
			},
			"Score": 0.9,
			"label": "person"
		}
	]
}

状态码

请参见状态码

错误码

请参见错误码

相关文档