更新时间:2025-07-29 GMT+08:00
分享

Pangu-CV-实例分割-1.1.0

功能介绍

能够对输入图片中的不同类别物体及物体个体进行分割识别,输出每个实例的类别标签、置信度及坐标信息。

服务调用方式:

  • 支持图片推理和视频推理。
  • 图片、视频推理支持在线和边缘部署。
  • 视频推理调用方式,需在创建部署任务时设置环境变量,添加rtsp视频流地址:
    • 添加环境变量,名称 “ADDRS”。环境变量的值为视频流地址,格式示例:rtsp://{边缘节点地址:端口}/{rtsp视频流地址}
    • 模型推理结果需在容器日志中查询,远程登录到部署服务器后,执行docker ps命令获取容器列表及其信息。
    • 记录部署任务名称,进入ModelArts服务的模型部署导航栏中按照模型的部署形式,进入在线服务、边缘服务页签按照任务名称找到对应的任务ID。按创建部署任务时生成的任务ID在容器信息中查找,找到与名称对应的CONTAINER ID。

    • 执行docker logs -f {CONTAINER ID}命令查看容器日志。在容器日志中可查看推理执行过程,搜索“result”可获取推理结果。

URI

POST /v1/{project_id}/infer-api/proxy/service/{deployment_id}/

获取URI方式请参见请求URI

请求参数

表1 请求Header参数(Token认证)

参数

是否必选

参数类型

描述

X-Auth-Token

String

参数解释:

用户Token。

用于获取操作API的权限。如图4中响应消息头中X-Subject-Token的值即为Token。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

Content-Type

String

参数解释:

发送的实体的MIME类型。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

application/json

表2 请求Header参数(API Key认证)

参数

是否必选

参数类型

描述

X-Apig-AppCode

String

参数解释:

API Key值。

用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

Content-Type

String

参数解释:

发送的实体的MIME类型。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

application/json

表3 请求参数

参数

是否必选

参数类型

说明

images

String

参数解释:

图像base64编码。

约束限制:

默认只支持RGB三通道图片数据,其他通道的数据暂不支持。

取值范围:

不涉及

默认取值:

不涉及

响应参数

表4 响应参数

参数

参数类型

描述

img_res

List

参数解释:

实例分割结果,请求成功有此字段,其中每个元素为一个实例的分割结果。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

dataset_id

String

参数解释:

训练数据集ID。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

表5 img_res中各项结构

参数

参数类型

描述

label

String

参数解释:

预测类别。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

score

Float

参数解释:

置信度。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

box

Dict

参数解释:

检测到的目标主体信息,格式为{"x":x1,"y":y1,"width":w,"height":h,"angle":r}。

  • x:检测到的目标主体区域的左上角x坐标。
  • y:检测到的目标主体区域的左上角y坐标。
  • width:检测到的目标主体区域的宽度。
  • height:检测到的目标主体区域的高度。
  • angle:默认为0,检测区域角度。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

mask

Dict

参数解释:

图像信息,格式为{"counts":string,"size":[h,w]}。

  • counts:基于游程编码的字符串,编码内容为和原图宽高相同的布尔数组:若数组某位置值为0,代表原图此位置像素点不属于检测目标,若为1,代表原图此位置像素点属于检测目标。可通过python开源库pycocotools._mask进行编码和解码。
  • size:图像尺寸,h为图像高,w为图像宽。

约束限制:

不涉及

取值范围:

不涉及

默认取值:

不涉及

请求示例

{ 
     "images": "/9j/4Vr2RXhpZgAASUkqAAgAAA....." 
}

响应示例

{
    "dataset_id": "12345",
    "img_res":
        [{"label":"person", "score": 0.958,
        "box": {"x": 131, "y": 186, "width": 128, "height": 102, "angle": 0},
        "mask":{'counts': 'PR`1h0n:0O2M5K4L4M4L6I7\\O\\NiFh1R9a0N2M3O0M301O00001O00000000000003NO01N2O0N3O2Nd0]O1N1O0O2O1N20000O100O2O0O101N3N1N2N2O1N1O1O1O1O010O0001O1O1O2N3M2ZFiNi8R2001O00001O00001O001O1O1O2N1O1O2N3M7F9I5J4M3N1O3M3L3M3N1N3M2M3MRfR3','size': [374, 500]}
         },...]
}

状态码

请参见状态码

错误码

请参见错误码

相关文档