创建进阶版语音训练任务
功能介绍
用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。
支持2种方式上传语音文件:
-
语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99.txt。
-
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。
文件上传后,调用“提交语音训练任务”接口,启动审核和训练。
调用方法
请参见如何调用API。
URI
POST /v1/{project_id}/voice-training-manage/user/middle-jobs
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
project_id |
是 |
String |
项目ID,获取方法请参考获取项目ID。 |
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
否 |
String |
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 |
Authorization |
否 |
String |
使用AK/SK方式认证时必选,携带的鉴权信息。 |
X-Sdk-Date |
否 |
String |
使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 |
X-Project-Id |
否 |
String |
使用AK/SK方式认证时必选,携带项目ID信息。 |
X-App-UserId |
否 |
String |
第三方用户ID。不允许输入中文。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
tag |
否 |
String |
任务标签。
|
description |
否 |
String |
一段描述信息,会呈现在资产库中。 |
sex |
否 |
String |
语音性别,是男性声音还是女性声音。
默认取值: FEMALE |
voice_name |
是 |
String |
音色名称。该名称会作为资产库中音色模型资产名称。 |
language |
否 |
String |
训练语言,当前仅支持中文。
默认取值: CN |
create_type |
否 |
String |
任务创建方式。
|
phone |
否 |
String |
手机号 |
dhtms_job_id |
否 |
String |
形象制作任务id |
batch_name |
否 |
String |
批次名称 |
output_language |
否 |
String |
模型输出语言类型 |
custom_text |
否 |
String |
自定义试听文本 |
响应参数
状态码: 200
参数 |
参数类型 |
描述 |
---|---|---|
job_id |
String |
任务id。 |
training_data_uploading_url |
String |
上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。
说明:
通过该obs地址上传时,需设置content-type为application/zip。 |
segment_uploading_url |
segment_uploading_url object |
分句上传任务的上传地址,create_type为segment时设置。 |
authorization_letter_uploading_url |
String |
授权书的上传地址。 |
参数 |
参数类型 |
描述 |
---|---|---|
audio_uploading_url |
Array of strings |
音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav |
txt_uploading_url |
Array of strings |
文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain |
状态码: 400
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
错误码。 |
error_msg |
String |
错误描述。 |
请求示例
POST https://{endpoint}/v1/3f0924078d1b471c884a5383d4dec9fa/voice-training-manage/user/middle-jobs { "tag" : "ECOMMERCE", "description" : "这是一段女声", "sex" : "FEMALE", "voice_name" : "温柔女声", "language" : "CN", "create_type" : "PACKAGE" }
响应示例
状态码: 200
处理成功返回。
{ "job_id" : "abcdefg", "training_data_uploading_url" : "https://my-bucket/data.zip", "segment_uploading_url" : { "audio_uploading_url" : [ "https://my-bucket/data0.wav" ], "txt_uploading_url" : [ "https://my-bucket/data0.txt" ] }, "authorization_letter_uploading_url" : "https://my-bucket/data" }
状态码
状态码 |
描述 |
---|---|
200 |
处理成功返回。 |
400 |
参数异常。 |
错误码
请参见错误码。