文档首页/ 盘古大模型 PanguLargeModels/ API参考/ API/ 模型推理接口/ CV大模型/ Pangu-CV-万物检测-V2

更新时间：2025-12-01 GMT+08:00

查看PDF

Pangu-CV-万物检测-V2

功能介绍

该模型主要实现物体检测的功能，输入图片的base64码和自定义的标签列表，模型识别出图片中该类别所在的位置，会返回带有标签的检测框信息和画好框的图片base64编码。

服务调用方式：

支持图片推理。
图片推理支持在线和边缘部署。

授权信息

账号具备所有API的调用权限，如果使用账号下的IAM用户调用当前API，该IAM用户需具备调用API所需的权限，具体权限要求请参见权限和授权项。

URI

POST /

获取URI方式请参见请求URI。

请求参数

表1 请求Header参数（Token认证）
参数	是否必选	参数类型	描述
X-Auth-Token	是（云上部署模型填写）	String	参数解释：用户Token。用于获取操作API的权限。如图4中响应消息头中X-Subject-Token的值即为Token。约束限制：不涉及取值范围：不涉及默认取值：不涉及
Content-Type	是	String	参数解释：发送的实体的MIME类型。约束限制：不涉及取值范围：不涉及默认取值：参数值为“application/json”

表2 请求Header参数（API Key认证）
参数	是否必选	参数类型	描述
X-Apig-AppCode	是（云上部署模型填写、边缘部署模型仅在监控网关访问模式下填写）	String	参数解释： API Key值。用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。约束限制：不涉及取值范围：不涉及默认取值：不涉及
Content-Type	是	String	参数解释：发送的实体的MIME类型。约束限制：不涉及取值范围：不涉及默认取值：参数值为“application/json”

表3 请求Body参数
参数	是否必选	参数类型	描述
images	是	String	参数解释：被检测图片的base64编码。约束限制：支持识别PNG、JPEG、BMP、JPG、WEBP格式的图片。只支持单张图片输入，分辨率范围为1px-10000px，base64编码后的图片大小不超过10MB，且长短边比例不能高于5。默认只支持RGB三通道图片数据，其他通道的数据暂不支持。取值范围：不涉及默认取值：不涉及
threshold	是	Float	参数解释：检测框置信度的阈值。约束限制：不涉及取值范围： [0, 1] 默认取值：不涉及

响应参数

状态码： 200

表4 响应Body参数
参数	参数类型	描述
result	MultimodalDINOResult object	参数解释：检测结果信息。约束限制：不涉及取值范围：不涉及默认取值：不涉及

表5 MultimodalDINOResult
参数	参数类型	描述
Box	object	参数解释：目标检测框坐标，[检测框左上角到竖轴距离,目标框左上角到横轴距离, 检测框宽度, 检测框高度]，{"X": x, "Y": y, "Width": w, "Height": h} 约束限制：不涉及取值范围：不涉及默认取值：不涉及
Score	Float	参数解释：目标检测置信度。约束限制：不涉及取值范围：不涉及默认取值：不涉及
label	String	参数解释：目标标签。约束限制：不涉及取值范围：不涉及默认取值：不涉及

状态码： 400

表6 响应Body参数
参数	参数类型	描述
error_code	String	错误码。
error_msg	String	错误信息。

请求示例

{
    "threshold": 0.25,
    "images": "/9j/4AAQSkZJRgABAQAAAQABAAD/......"
}

响应示例

{
	"result": [
		{
			"Box": {
				"Y": 0,
				"Width": 100,
				"X": 0,
				"Height": 100
			},
			"Score": 0.9,
			"label": "person"
		}
	]
}

状态码

请参见状态码。

错误码

请参见错误码。

父主题： CV大模型

上一篇：Pangu-CV-实例分割-1.1.0

下一篇：Pangu-CV-视觉交互检测-V3

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

盘古Doer提问云社区提问