创建声音制作任务(第三方模型)
MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示:
- 输入的语言不受限制。默认支持19种输入语言(中文、英文、粤语、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、荷兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、泰语)的声音制作,操作请参考创建声音制作任务(第三方模型)。
- 输出的语言受限制。使用自定义声音合成音频时,仅支持17种语言:中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语(暂未开放泰语)。
操作前准备
用户创建声音制作任务前,需要参考操作步骤准备完成如下内容:
- “语料上传”方式制作声音时,需要参考声音制作页面的“录音指导”录制音频。
- 签署声音授权文件,如授权书所示。
- 购买小语种克隆套餐包并激活使用,操作请参考购买出门问问声音套餐。
操作步骤
- 单击“声音制作”下方的“开始创建”,进入声音制作页面。
- 选择“第三方模型”页签的“出门问问声音制作”方式。
界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。
- 配置声音制作参数。
界面操作详情,如表1所示。
表1 界面操作说明 区域
说明
声音制作方式
选择“出门问问声音制作”。音频时长为0.5~180分钟,建议5分钟。音频格式为WAV或MP3文件,支持19种语言的声音制作。
音频总时长,建议5分钟;单段不低于5秒
如果剩余次数为0,可单击“立即购买”,参考购买出门问问小语种克隆套餐的操作流程购买小语种克隆套餐包。
请完善声音信息
输入声音名称。
示例:欢快女声。
请制作声音
界面提供录音指导,需要按照指导录制1分钟的长音频WAV或MP3文件。WAV或MP3文件支持直接上传,无需压缩,无需携带文案txt文件。
如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。
请选择声音性别
声音的性别,用于匹配声音模型的精准度。
如下所示:
- 男生
- 女生
请选择原始输入语言
上传语料所使用的语言。
包含19种语言:中文、英文、粤语、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、荷兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、泰语。
须知:当前参数配置仅作为标识,对训练结果没有任何影响。
请选择输出模型语言
选择输出的声音模型支持的语言。
支持如下语言:
- 多语种:输出的声音模型,支持合成的语言类型包括中文、英文、德语、法语、土耳其语、菲律宾语、日语、意大利语、马来语、俄罗斯语、韩语、芬兰语、西班牙语、印尼语、阿拉伯语、葡萄牙语、荷兰语。
- 粤语
选择声音标签
声音的标签。作用为选择声音时,快速筛选领域。
包含如下选项:
- 新闻
- 营销
针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(基础版)、文案样例(进阶版)和文案样例(高品质)所示。如果使用预置文案,必须选对标签。
请输入试听文本
请输入试听文本,声音训练完成以后,您可以试听该文本的合成效果。
声音授权
单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。
授权书内容,可参考授权书。
联系方式(可选)
请输入手机号。
- 单击“提交制作”。
弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
- 如果用户确认无误,单击“确认提交”。
声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。
- 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。
当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。