批量添加样本
功能介绍
批量添加样本。
调试
您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。
URI
POST /v2/{project_id}/datasets/{dataset_id}/data-annotations/samples
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
dataset_id |
是 |
String |
数据集ID。 |
project_id |
是 |
String |
用户项目ID。获取方法请参见获取项目ID和名称。 |
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
final_annotation |
否 |
Boolean |
是否直接导入到最终结果。可选值如下:
|
label_format |
否 |
LabelFormat object |
标签格式,此参数仅文本类数据集使用。 |
samples |
否 |
Array of Sample objects |
样本列表。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
label_type |
否 |
String |
文本分类的标签类型。可选值如下:
|
text_label_separator |
否 |
String |
标签与标签之间的分隔符,默认为逗号分隔,分隔符需转义。分隔符仅支持一个字符,必须为大小写字母,数字和“!@#$%^&*_=|?/':.;,”其中的某一字符。 |
text_sample_separator |
否 |
String |
文本与标签之间的分隔符,默认为Tab键分隔,分隔符需转义。分隔符仅支持一个字符,必须为大小写字母,数字和“!@#$%^&*_=|?/':.;,”其中的某一字符。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
data |
否 |
Object |
样本文件的字节数据。类型为java.nio.ByteBuffer,前台调用时传字节数据转换后的字符串。 |
data_source |
否 |
DataSource object |
数据来源。 |
encoding |
否 |
String |
样本文件的编码类型,用于文本类型(txt/csv)的文件上传。取值有UTF-8、GBK、GB2312等,默认为UTF-8编码。 |
labels |
否 |
Array of SampleLabel objects |
样本标签列表。 |
metadata |
否 |
SampleMetadata object |
样本metadata属性键值对。 |
name |
否 |
String |
样本文件名称,名称不能包含!<>=&"'特殊字符,长度为0-1024位。 |
sample_type |
否 |
Integer |
样本类型。可选值如下:
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
data_path |
否 |
String |
数据源所在路径。 |
data_type |
否 |
Integer |
数据类型。可选值如下:
|
schema_maps |
否 |
Array of SchemaMap objects |
表格数据对应的schema映射信息。 |
source_info |
否 |
SourceInfo object |
导入表格数据源所需的信息。 |
with_column_header |
否 |
Boolean |
文件中首行是否是列名,用于表格数据集。可选值如下:
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
cluster_id |
否 |
String |
MRS集群ID。可登录MRS控制台查看。 |
cluster_mode |
否 |
String |
MRS集群运行模式。可选值如下:
|
cluster_name |
否 |
String |
MRS集群名称。可登录MRS控制台查看。 |
database_name |
否 |
String |
导入表格数据集,数据库名字。 |
input |
否 |
String |
表格数据集,HDFS路径。例如/datasets/demo。 |
ip |
否 |
String |
用户GaussDB(DWS)集群的IP地址。 |
port |
否 |
String |
用户GaussDB(DWS)集群的端口。 |
queue_name |
否 |
String |
表格数据集,DLI队列名。 |
subnet_id |
否 |
String |
MRS集群的子网ID。 |
table_name |
否 |
String |
导入表格数据集,表名。 |
user_name |
否 |
String |
用户名,GaussDB(DWS)数据需提供此参数。 |
user_password |
否 |
String |
用户密码,GaussDB(DWS)数据需提供此参数。 |
vpc_id |
否 |
String |
MRS集群所在的vpc的ID。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
annotated_by |
否 |
String |
视频标注途径,用于区分标签是人工标注的还是自动标注的。可选值如下:
|
id |
否 |
String |
标签ID。 |
name |
否 |
String |
标签名。 |
property |
否 |
SampleLabelProperty object |
样本标签的属性键值对,如物体形状、形状特征等。 |
score |
否 |
Float |
置信度,取值范围为[0,1] |
type |
否 |
Integer |
标签类型。可选值如下:
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
@modelarts:content |
否 |
String |
语音标签(包含语音内容和语音起止点)专用内置属性:语音文本内容。 |
@modelarts:end_index |
否 |
Integer |
命名实体标签专用内置属性:文本的结束位置,但不包括end_index所指的字符。例如:
|
@modelarts:end_time |
否 |
String |
语音起止点标签专用内置属性:语音的结束时间,格式“hh:mm:ss.SSS”(其中hh表示小时,mm表示分钟,ss表示秒,SSS表示毫秒)。 |
@modelarts:feature |
否 |
Object |
物体检测标签专用内置属性:形状特征,类型为List。以图片的左上角为坐标原点[0, 0],每个坐标点的表示方法为[x, y],x表示横坐标,y表示纵坐标(x和y均>=0)。每种形状的格式如下:
|
@modelarts:from |
否 |
String |
三元组关系标签专用内置属性:三元组关系标签的起始实体ID。 |
@modelarts:hard |
否 |
String |
内置属性:标签级别是否难例。可选值为:
|
@modelarts:hard_coefficient |
否 |
String |
内置属性:标签级别难度系数。范围为[0,1]。 |
@modelarts:hard_reasons |
否 |
String |
内置属性:标签级别难例原因。通过中划线间隔单个难例原因ID,例如:“3-20-21-19”。难例原因ID可选值如下:
|
@modelarts:shape |
否 |
String |
物体检测标签专用内置属性:物体形状,默认为空。可选值如下:
|
@modelarts:source |
否 |
String |
语音起止点标签专用内置属性:语音来源(例如说话人/旁白等)。 |
@modelarts:start_index |
否 |
Integer |
命名实体标签专用内置属性:文本的起始位置,值从0开始,包括start_index所指的字符。 |
@modelarts:start_time |
否 |
String |
语音起止点标签专用内置属性:语音的起始时间,格式“hh:mm:ss.SSS”(其中hh表示小时,mm表示分钟,ss表示秒,SSS表示毫秒)。 |
@modelarts:to |
否 |
String |
三元组关系标签专用内置属性:三元组关系标签的指向实体ID。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
@modelarts:import_origin |
否 |
Integer |
内置属性:样本来源。 |
@modelarts:hard |
否 |
Double |
内置属性:样本级别是否难例。可选值为:
|
@modelarts:hard_coefficient |
否 |
Double |
内置属性:样本级别难度系数。范围为[0,1]。 |
@modelarts:hard_reasons |
否 |
Array of integers |
内置属性:样本级别难例原因ID列表。难例原因ID可选值如下:
|
@modelarts:size |
否 |
Array of objects |
内置属性:图像尺寸(图像的宽度、高度、深度),类型为List[/topic/body/section/table/tgroup/tbody/row/entry/p/br {""}) (br]。列表中的第一个数字为宽度(像素),第二个数字为高度(像素),第三个数字为深度(深度可以没有,默认为3),如[100,200,3]和[100,200]均合法。 说明:只有当样本的标签列表包含物体检测标签时,此字段必选。 |
响应参数
状态码: 200
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
操作失败的错误码。 |
error_msg |
String |
操作失败的错误信息。 |
results |
Array of UploadSampleResp objects |
批量添加样本的响应列表。 |
success |
Boolean |
操作是否执行成功。可选值如下:
|
请求示例
批量添加样本
{ "samples" : [ { "name" : "2.jpg", "data" : "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDAAgGBgcGBQgHBwcJCQgKDBQNDAsLDBkSEw8UHRofHh0aHBwgJC4nICIsIxwcKDcpLDAxNDQ0Hyc5PTgyPC4zNDL/2wBDAQkJCQwLDBgNDRgyIRwhMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjIyMjL/wAARCAA1AJUDASIAAhEBAxEB/8QAHwAAAQUBAQEBAQEAAAAAAAAAAAECAwQFBgcICQoL/8QAtRAAAgEDAwIEAwUFBAQAAAF9AQIDAAQRBRIhMUEGE1FhByJxFDKBkaEII0KxwRVS0fAkM2JyggkKFhcYGRolJicoKSo0NTY3ODk6Q0RFRkdISUpTVFVWV1hZWmNkZWZnaGlqc3R1dnd4eXqDhIWGh4iJipKTlJWWl5iZmqKjpKWmp6ipqrKztLW2t7i5usLDxMXGx8jJytLT1NXW19jZ2uHi4+Tl5ufo6erx8vP09fb3+Pn6/8QAHwEAAwEBAQEBAQEBAQAAAAAAAAECAwQFBgcICQoL" } ] }
响应示例
状态码: 200
OK
{ "success" : true, "results" : [ { "success" : true, "name" : "/test-obs/classify/input/animals/2.jpg", "info" : "960585877c92d63911ba555ab3129d36" } ] }
状态码
状态码 |
描述 |
---|---|
200 |
OK |
401 |
Unauthorized |
403 |
Forbidden |
404 |
Not Found |
错误码
请参见错误码。