批量更新团队标注样本的标签

功能介绍

批量更新团队标注样本的标签。

调试

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

URI

PUT /v2/{project_id}/datasets/{dataset_id}/workforce-tasks/{workforce_task_id}/data-annotations/samples

表1 路径参数
参数	是否必选	参数类型	描述
dataset_id	是	String	数据集ID。
project_id	是	String	用户项目ID。获取方法请参见获取项目ID和名称。
workforce_task_id	是	String	标注任务ID。

请求参数

表2 请求Body参数
参数	是否必选	参数类型	描述
email	否	String	团队标注成员邮箱。
samples	否	Array of SampleLabels objects	更新的样本列表。

表3 SampleLabels
参数	是否必选	参数类型	描述
labels	否	Array of SampleLabel objects	样本标签列表，为空表示删除样本的所有标签。
metadata	否	SampleMetadata object	样本metadata属性键值对。
sample_id	否	String	样本ID。
sample_type	否	Integer	样本类型。可选值如下： 0：图像 1：文本 2：语音 4：表格 6：视频 9：自由格式
sample_usage	否	String	样本用处。可选值如下： TRAIN：训练 EVAL：验证 TEST：测试 INFERENCE：推理
source	否	String	样本数据源地址，通过调用样本列表接口获取。
worker_id	否	String	团队标注的成员ID。

表4 SampleLabel
参数	是否必选	参数类型	描述
annotated_by	否	String	视频标注途径，用于区分标签是人工标注的还是自动标注的。可选值如下： human：人工标注 auto：自动标注
id	否	String	标签ID。
name	否	String	标签名。
property	否	SampleLabelProperty object	样本标签的属性键值对，如物体形状、形状特征等。
score	否	Float	置信度，取值范围为[0,1]
type	否	Integer	标签类型。可选值如下： 0：图像分类 1：物体检测 3: 图像分割 100：文本分类 101：命名实体 102：文本三元组关系标签 103：文本三元组实体标签 200：语音分类 201：语音内容 202：语音分割 600：视频标注

表5 SampleLabelProperty
参数	是否必选	参数类型	描述
@modelarts:content	否	String	语音标签（包含语音内容和语音起止点）专用内置属性：语音文本内容。
@modelarts:end_index	否	Integer	命名实体标签专用内置属性：文本的结束位置，但不包括end_index所指的字符。例如：文本内容为“Barack Hussein Obama II (born August 4, 1961) is a attorney and politician.”，则其中人名“Barack Hussein Obama II”的start_index为0，end_index为23。文本内容为“截止到2018年底，本公司人员规模已经超过100”，则其中时间“2018年底”的start_index为3，end_index为9。
@modelarts:end_time	否	String	语音起止点标签专用内置属性：语音的结束时间，格式“hh:mm:ss.SSS”(其中hh表示小时，mm表示分钟，ss表示秒，SSS表示毫秒)。
@modelarts:feature	否	Object	物体检测标签专用内置属性：形状特征，类型为List。以图片的左上角为坐标原点[0, 0]，每个坐标点的表示方法为[x, y]，x表示横坐标，y表示纵坐标(x和y均>=0)。每种形状的格式如下： bndbox [[0,10],[50,95]] 两个点组成，矩形的左上角为第一个点，矩形的右下角为第二个点(即第一个点x坐标一定小于第二个点的x坐标，第一个点y坐标一定小于第二个点的y坐标)。 polygon [[0,100],[50,95],[10,60],[500,400]] 多个点组成，按顺序连接成一个多边形。 circle [[100,100],[50]] 一个圆心点和半径组成。 line [[0,100],[50,95]] 两个点组成，第一个点起始点，第二个点为终止点。 dashed [[0,100],[50,95]] 两个点组成，第一个点起始点，第二个点为终止点。 point [[0,100]] 一个点组成。 polyline [[0,100],[50,95],[10,60],[500,400]] 折线，多个点组成。
@modelarts:from	否	String	三元组关系标签专用内置属性：三元组关系标签的起始实体ID。
@modelarts:hard	否	String	内置属性：标签级别是否难例。可选值为： 0/false：非难例 1/true：难例
@modelarts:hard_coefficient	否	String	内置属性：标签级别难度系数。范围为[0,1]。
@modelarts:hard_reasons	否	String	内置属性：标签级别难例原因。通过中划线间隔单个难例原因ID，例如：“3-20-21-19”。难例原因ID可选值如下： 0：未识别出任何目标物体。 1：置信度偏低。 2：基于训练数据集的聚类结果和预测结果不一致。 3：预测结果和训练集同类别数据差异较大。 4：连续多张相似图片的预测结果不一致。 5：图像的分辨率与训练数据集的特征分布存在较大偏移。 6：图像的高宽比与训练数据集的特征分布存在较大偏移。 7：图像的亮度与训练数据集的特征分布存在较大偏移。 8：图像的饱和度与训练数据集的特征分布存在较大偏移。 9：图像的色彩丰富程度与训练数据集的特征分布存在较大偏移。 10：图像的清晰度与训练数据集的特征分布存在较大偏移。 11：图像的目标框数量与训练数据集的特征分布存在较大偏移。 12：图像中目标框的面积标准差与训练数据集的特征分布存在较大偏移。 13：图像中目标框的高宽比与训练数据集的特征分布存在较大偏移。 14：图像中目标框的面积占比与训练数据集的特征分布存在较大偏移。 15：图像中目标框的边缘化程度与训练数据集的特征分布存在较大偏移。 16：图像中目标框的亮度与训练数据集的特征分布存在较大偏移。 17：图像中目标框的清晰度与训练数据集的特征分布存在较大偏移。 18：图像中目标框的堆叠程度与训练数据集的特征分布存在较大偏移。 19：基于gaussianblur的数据增强与原图预测结果不一致。 20：基于fliplr的数据增强与原图预测结果不一致。 21：基于crop的数据增强与原图预测结果不一致。 22：基于flipud的数据增强与原图预测结果不一致。 23：基于scale的数据增强与原图预测结果不一致。 24：基于translate的数据增强与原图预测结果不一致。 25：基于shear的数据增强与原图预测结果不一致。 26：基于superpixels的数据增强与原图预测结果不一致。 27：基于sharpen的数据增强与原图预测结果不一致。 28：基于add的数据增强与原图预测结果不一致。 29：基于invert的数据增强与原图预测结果不一致。 30：数据被预测为异常点。
@modelarts:shape	否	String	物体检测标签专用内置属性：物体形状，默认为空。可选值如下： bndbox：矩形。 polygon：多边形。 circle：圆形。 line：直线。 dashed：虚线。 point：点。 polyline：折线。
@modelarts:source	否	String	语音起止点标签专用内置属性：语音来源(例如说话人/旁白等)。
@modelarts:start_index	否	Integer	命名实体标签专用内置属性：文本的起始位置，值从0开始，包括start_index所指的字符。
@modelarts:start_time	否	String	语音起止点标签专用内置属性：语音的起始时间，格式“hh:mm:ss.SSS”(其中hh表示小时，mm表示分钟，ss表示秒，SSS表示毫秒)。
@modelarts:to	否	String	三元组关系标签专用内置属性：三元组关系标签的指向实体ID。

表6 SampleMetadata
参数	是否必选	参数类型	描述
@modelarts:import_origin	否	Integer	内置属性：样本来源。
@modelarts:hard	否	Double	内置属性：样本级别是否难例。可选值为： 0：非难例 1：难例
@modelarts:hard_coefficient	否	Double	内置属性：样本级别难度系数。范围为[0,1]。
@modelarts:hard_reasons	否	Array of integers	内置属性：样本级别难例原因ID列表。难例原因ID可选值如下： 0：未识别出任何目标物体。 1：置信度偏低。 2：基于训练数据集的聚类结果和预测结果不一致。 3：预测结果和训练集同类别数据差异较大。 4：连续多张相似图片的预测结果不一致。 5：图像的分辨率与训练数据集的特征分布存在较大偏移。 6：图像的高宽比与训练数据集的特征分布存在较大偏移。 7：图像的亮度与训练数据集的特征分布存在较大偏移。 8：图像的饱和度与训练数据集的特征分布存在较大偏移。 9：图像的色彩丰富程度与训练数据集的特征分布存在较大偏移。 10：图像的清晰度与训练数据集的特征分布存在较大偏移。 11：图像的目标框数量与训练数据集的特征分布存在较大偏移。 12：图像中目标框的面积标准差与训练数据集的特征分布存在较大偏移。 13：图像中目标框的高宽比与训练数据集的特征分布存在较大偏移。 14：图像中目标框的面积占比与训练数据集的特征分布存在较大偏移。 15：图像中目标框的边缘化程度与训练数据集的特征分布存在较大偏移。 16：图像中目标框的亮度与训练数据集的特征分布存在较大偏移。 17：图像中目标框的清晰度与训练数据集的特征分布存在较大偏移。 18：图像中目标框的堆叠程度与训练数据集的特征分布存在较大偏移。 19：基于gaussianblur的数据增强与原图预测结果不一致。 20：基于fliplr的数据增强与原图预测结果不一致。 21：基于crop的数据增强与原图预测结果不一致。 22：基于flipud的数据增强与原图预测结果不一致。 23：基于scale的数据增强与原图预测结果不一致。 24：基于translate的数据增强与原图预测结果不一致。 25：基于shear的数据增强与原图预测结果不一致。 26：基于superpixels的数据增强与原图预测结果不一致。 27：基于sharpen的数据增强与原图预测结果不一致。 28：基于add的数据增强与原图预测结果不一致。 29：基于invert的数据增强与原图预测结果不一致。 30：数据被预测为异常点。
@modelarts:size	否	Array of objects	内置属性：图像尺寸（图像的宽度、高度、深度），类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素)，第二个数字为高度(像素)，第三个数字为深度(深度可以没有，默认为3)，如[100,200,3]和[100,200]均合法。说明：只有当样本的标签列表包含物体检测标签时，此字段必选。

响应参数

状态码： 200

表7 响应Body参数
参数	参数类型	描述
error_code	String	操作失败的错误码。
error_msg	String	操作失败的错误信息。
results	Array of BatchResponse objects	批量更新样本标签的响应结果列表。
success	Boolean	操作是否执行成功。可选值如下： true：执行成功 false：执行失败

表8 BatchResponse
参数	参数类型	描述
error_code	String	操作失败的错误码。
error_msg	String	操作失败的错误信息。
success	Boolean	操作是否执行成功。可选值如下： true：执行成功 false：执行失败

请求示例

批量更新团队标注样本的标签

{
  "samples" : [ {
    "sample_id" : "0a0939d6d3c48a3d2a2619245943ac21",
    "worker_id" : "8c15ad080d3eabad14037b4eb00d6a6f",
    "labels" : [ {
      "name" : "tulips"
    } ]
  }, {
    "sample_id" : "0e1b5a16a5a577ee53aeb34278a4b3e7",
    "worker_id" : "8c15ad080d3eabad14037b4eb00d6a6f",
    "labels" : [ {
      "name" : "tulips"
    } ]
  } ]
}