创建进阶版语音训练任务 - CreateTrainingMiddleJob

功能介绍

用户创建语音训练进阶版任务，该接口会返回一个obs上传地址，用于上传语音文件。

支持2种方式上传语音文件：

语音文件和文本文件打包成zip上传：语音文件已经切分成100个wav文件，每个语音文件对应一个txt文本文件，所有文件打包成zip文件。语音文件命名规则：0.wav~99.wav；文本文件命名规则：0.txt~99.txt。
语音文件和文本文件逐句上传：每次上传一句语料的语音文件和文本文件，再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。

文件上传后，调用“提交语音训练任务”接口，启动审核和训练。

调用方法

请参见如何调用API。

授权信息

账号具备所有API的调用权限，如果使用账号下的IAM用户调用当前API，该IAM用户需具备调用API所需的权限，具体权限要求请参见权限和授权项。

URI

POST /v1/{project_id}/voice-training-manage/user/middle-jobs

表1 路径参数
参数	是否必选	参数类型	描述
project_id	是	String	项目ID，获取方法请参考获取项目ID。

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	否	String	用户Token。使用Token鉴权方式时必选。通过调用IAM服务获取用户Token接口获取。响应消息头中X-Subject-Token的值。
Authorization	否	String	使用AK/SK方式认证时必选，携带的鉴权信息。
X-Sdk-Date	否	String	使用AK/SK方式认证时必选，请求的发生时间。格式为(YYYYMMDD'T'HHMMSS'Z')。
X-Project-Id	否	String	使用AK/SK方式认证时必选，携带项目ID信息。
X-App-UserId	否	String	第三方用户ID。不允许输入中文。

表3 请求Body参数
参数	是否必选	参数类型	描述
tag	否	String	任务标签。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 LIVE: 直播 EDUCATION: 教培 CUSTOMER: 客服 STORYTELLING: 故事
description	否	String	一段描述信息,会呈现在资产库中。
sex	否	String	语音性别,是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性默认取值： FEMALE
voice_name	是	String	音色名称。该名称会作为资产库中音色模型资产名称。
language	否	String	训练语言,当前仅支持中文。 CN: 中文 EN: 英文默认取值： CN
create_type	否	String	任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据
phone	否	String	手机号
dhtms_job_id	否	String	形象制作任务id
batch_name	否	String	批次名称
output_language	否	String	模型输出语言类型
custom_text	否	String	自定义试听文本
is_ondemand_resource	否	Boolean	是否使用按需资源
supported_service	否	Array of strings	支持的业务类型。 VIDEO_2D：分身数字人视频制作 LIVE_2D：分身数字人直播 CHAT_2D：分身数字人智能交互

响应参数

状态码：200

表4 响应Body参数
参数	参数类型	描述
job_id	String	任务id。
training_data_uploading_url	String	上传训练数据的地址。训练数据需打包成zip文件后，上传至该url。 create_type取值为package时设置。说明：通过该obs地址上传时，需设置content-type为application/zip。
segment_uploading_url	segment_uploading_url object	分句上传任务的上传地址,create_type为segment时设置。
authorization_letter_uploading_url	String	授权书的上传地址。

表5 segment_uploading_url
参数	参数类型	描述
audio_uploading_url	Array of strings	音频上传的地址。通过该obs地址上传时，需设置content-type为audio/wav
txt_uploading_url	Array of strings	文本上传的地址。通过该obs地址上传时需设置content-type为text/plain

状态码：400

表6 响应Body参数
参数	参数类型	描述
error_code	String	错误码。
error_msg	String	错误描述。

请求示例

POST https://{endpoint}/v1/3f0924078d1b471c884a5383d4dec9fa/voice-training-manage/user/middle-jobs

{
  "tag" : "ECOMMERCE",
  "description" : "这是一段女声",
  "sex" : "FEMALE",
  "voice_name" : "温柔女声",
  "language" : "CN",
  "create_type" : "PACKAGE"
}

响应示例

状态码：200

处理成功返回。

{
  "job_id" : "abcdefg",
  "training_data_uploading_url" : "https://my-bucket/data.zip",
  "segment_uploading_url" : {
    "audio_uploading_url" : [ "https://my-bucket/data0.wav" ],
    "txt_uploading_url" : [ "https://my-bucket/data0.txt" ]
  },
  "authorization_letter_uploading_url" : "https://my-bucket/data"
}

状态码

状态码	描述
200	处理成功返回。
400	参数异常。

错误码

请参见错误码。

父主题：声音制作任务管理

上一篇：创建基础版语音训练任务 - CreateTrainingBasicJob

下一篇：创建高级版语音训练任务 - CreateTrainingAdvanceJob

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试