创建声音制作任务(自研模型)
MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用自研模型自定义生成声音。
操作限制
MetaStudio不支持个人用户定制声音,仅支持企业用户。
操作步骤
- 单击“声音制作”下方的“开始创建”,进入声音制作页面。
界面左侧是声音制作页面,右侧为声音制作流程。图1 定制声音
- 在“华为模型”页签,配置声音制作参数。
界面操作详情,如表1所示。
表1 界面操作说明 区域
说明
声音制作
声音制作需整段录制生成一个WAV或MP3格式的音频文件,时长10~30分钟,建议15分钟。
声音制作方式后面会展示剩余次数,需要保证剩余次数充足。录制过程中,每句之间有2~3秒的停顿。
请完善声音信息
输入声音名称。
示例:欢快女声。
请制作声音
制作声音的方式为“语料上传”。界面提供录音指导,需要按照指导录制生成一个WAV或MP3格式的音频文件。
WAV或MP3格式文件支持直接上传,无需压缩,无需携带文案txt文件。
如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。
请选择声音性别
声音的性别,用于匹配声音模型的精准度。
如下所示:
- 男生
- 女生
原始输入语言
上传语料所使用的语言。
包含如下语言:
- 中文
- 英文
须知:当前参数配置仅作为标识,对训练结果没有任何影响。
选择声音标签
声音的标签。作用为选择声音时,快速筛选领域。
包含如下选项:
- 新闻
- 营销
针对上述标签,MetaStudio服务预置了相应的文案内容,如文案样例(进阶版)所示。如果使用预置文案,必须选对标签。
联系方式(可选)
可输入有效的手机号。
- 单击“提交制作”。
弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
- 如果用户确认无误,单击“确认提交”。
声音制作任务提交成功后,界面提示“制作任务提交成功”,如图2所示。
模型审核和制作耗时约7个工作日。
- 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。
当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。