创建进阶版语音训练任务 - CreateTrainingMiddleJob
功能介绍
用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。
支持2种方式上传语音文件:
语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99.txt。
语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。
文件上传后,调用“提交语音训练任务”接口,启动审核和训练。
调用方法
请参见如何调用API。
授权信息
账号具备所有API的调用权限,如果使用账号下的IAM用户调用当前API,该IAM用户需具备调用API所需的权限,具体权限要求请参见权限和授权项。
URI
POST /v1/{project_id}/voice-training-manage/user/middle-jobs
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
project_id | 是 | String | 项目ID,获取方法请参考获取项目ID。 |
请求参数
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
X-Auth-Token | 否 | String | 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 |
Authorization | 否 | String | 使用AK/SK方式认证时必选,携带的鉴权信息。 |
X-Sdk-Date | 否 | String | 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 |
X-Project-Id | 否 | String | 使用AK/SK方式认证时必选,携带项目ID信息。 |
X-App-UserId | 否 | String | 第三方用户ID。不允许输入中文。 |
参数 | 是否必选 | 参数类型 | 描述 |
|---|---|---|---|
tag | 否 | String | 任务标签。 |
description | 否 | String | 一段描述信息,会呈现在资产库中。 |
sex | 否 | String | 语音性别,是男性声音还是女性声音。 默认取值: FEMALE |
voice_name | 是 | String | 音色名称。该名称会作为资产库中音色模型资产名称。 |
language | 否 | String | 训练语言,当前仅支持中文。 默认取值: CN |
create_type | 否 | String | 任务创建方式。 |
phone | 否 | String | 手机号 |
dhtms_job_id | 否 | String | 形象制作任务id |
batch_name | 否 | String | 批次名称 |
output_language | 否 | String | 模型输出语言类型 |
custom_text | 否 | String | 自定义试听文本 |
is_ondemand_resource | 否 | Boolean | 是否使用按需资源 |
supported_service | 否 | Array of strings | 支持的业务类型。 |
响应参数
状态码:200
参数 | 参数类型 | 描述 |
|---|---|---|
job_id | String | 任务id。 |
training_data_uploading_url | String | 上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。 create_type取值为package时设置。 说明: 通过该obs地址上传时,需设置content-type为application/zip。 |
segment_uploading_url | segment_uploading_url object | 分句上传任务的上传地址,create_type为segment时设置。 |
authorization_letter_uploading_url | String | 授权书的上传地址。 |
参数 | 参数类型 | 描述 |
|---|---|---|
audio_uploading_url | Array of strings | 音频上传的地址。 通过该obs地址上传时,需设置content-type为audio/wav |
txt_uploading_url | Array of strings | 文本上传的地址。 通过该obs地址上传时需设置content-type为text/plain |
状态码:400
参数 | 参数类型 | 描述 |
|---|---|---|
error_code | String | 错误码。 |
error_msg | String | 错误描述。 |
请求示例
POST https://{endpoint}/v1/3f0924078d1b471c884a5383d4dec9fa/voice-training-manage/user/middle-jobs
{
"tag" : "ECOMMERCE",
"description" : "这是一段女声",
"sex" : "FEMALE",
"voice_name" : "温柔女声",
"language" : "CN",
"create_type" : "PACKAGE"
} 响应示例
状态码:200
处理成功返回。
{
"job_id" : "abcdefg",
"training_data_uploading_url" : "https://my-bucket/data.zip",
"segment_uploading_url" : {
"audio_uploading_url" : [ "https://my-bucket/data0.wav" ],
"txt_uploading_url" : [ "https://my-bucket/data0.txt" ]
},
"authorization_letter_uploading_url" : "https://my-bucket/data"
} 状态码
状态码 | 描述 |
|---|---|
200 | 处理成功返回。 |
400 | 参数异常。 |
错误码
请参见错误码。

