更新时间:2024-12-12 GMT+08:00

创建进阶版语音训练任务

功能介绍

用户创建语音训练进阶版任务,该接口会返回一个obs上传地址,用于上传语音文件。

支持2种方式上传语音文件:

  • 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99.txt。

  • 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。

文件上传后,调用“提交语音训练任务”接口,启动审核和训练。

调用方法

请参见如何调用API

URI

POST /v1/{project_id}/voice-training-manage/user/middle-jobs

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

项目ID,获取方法请参考获取项目ID

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。使用Token鉴权方式时必选。

通过调用IAM服务获取用户Token接口获取。

响应消息头中X-Subject-Token的值。

Authorization

String

使用AK/SK方式认证时必选,携带的鉴权信息。

X-Sdk-Date

String

使用AK/SK方式认证时必选,请求的发生时间。

格式为(YYYYMMDD'T'HHMMSS'Z')。

X-Project-Id

String

使用AK/SK方式认证时必选,携带项目ID信息。

X-App-UserId

String

第三方用户ID。不允许输入中文。

表3 请求Body参数

参数

是否必选

参数类型

描述

tag

String

任务标签。

  • ECOMMERCE: 电商

  • NEWS: 新闻

  • MARKETING: 营销

description

String

一段描述信息,会呈现在资产库中。

sex

String

语音性别,是男性声音还是女性声音。

  • FEMALE: 女性

  • MALE: 男性

默认取值:

FEMALE

voice_name

String

音色名称。该名称会作为资产库中音色模型资产名称。

language

String

训练语言,当前仅支持中文。

  • CN: 中文

  • EN: 英文

默认取值:

CN

create_type

String

任务创建方式。

  • PACKAGE: 使用一个zip包包含所有数据

  • SEGMENT: 逐句上传数据

phone

String

手机号

dhtms_job_id

String

形象制作任务id

batch_name

String

批次名称

output_language

String

模型输出语言类型

custom_text

String

自定义试听文本

响应参数

状态码: 200

表4 响应Body参数

参数

参数类型

描述

job_id

String

任务id。

training_data_uploading_url

String

上传训练数据的地址。训练数据需打包成zip文件后,上传至该url。

create_type取值为package时设置。

说明:

通过该obs地址上传时,需设置content-type为application/zip。

segment_uploading_url

segment_uploading_url object

分句上传任务的上传地址,create_type为segment时设置。

authorization_letter_uploading_url

String

授权书的上传地址。

表5 segment_uploading_url

参数

参数类型

描述

audio_uploading_url

Array of strings

音频上传的地址。

通过该obs地址上传时,需设置content-type为audio/wav

txt_uploading_url

Array of strings

文本上传的地址。

通过该obs地址上传时需设置content-type为text/plain

状态码: 400

表6 响应Body参数

参数

参数类型

描述

error_code

String

错误码。

error_msg

String

错误描述。

请求示例

POST https://{endpoint}/v1/3f0924078d1b471c884a5383d4dec9fa/voice-training-manage/user/middle-jobs

{
  "tag" : "ECOMMERCE",
  "description" : "这是一段女声",
  "sex" : "FEMALE",
  "voice_name" : "温柔女声",
  "language" : "CN",
  "create_type" : "PACKAGE"
}

响应示例

状态码: 200

处理成功返回。

{
  "job_id" : "abcdefg",
  "training_data_uploading_url" : "https://my-bucket/data.zip",
  "segment_uploading_url" : {
    "audio_uploading_url" : [ "https://my-bucket/data0.wav" ],
    "txt_uploading_url" : [ "https://my-bucket/data0.txt" ]
  },
  "authorization_letter_uploading_url" : "https://my-bucket/data"
}

状态码

状态码

描述

200

处理成功返回。

400

参数异常。

错误码

请参见错误码