声音制作

MetaStudio支持自定义生成声音。

用户创建声音制作任务前，需要参考操作步骤准备如下内容：

本视频介绍华为云MetaStudio的声音模型训练功能，指导用户在控制台进行声音模型训练，生成数字人声音。

在“华为模型”页签，配置声音制作参数。

界面操作详情，如表1所示。

表1 界面操作说明
区域	说明
声音制作方式	选择“声音制作”，音频格式为WAV或MP3文件。需整段录制，每句之间有2~3秒的停顿。音频时长10~30分钟，建议15分钟。
请完善声音信息	输入声音名称，示例：欢快女声。
请制作声音	使用“语料上传”的方式，直接上传一个已录制好的长音频WAV或MP3文件，无需压缩，无需携带文案txt文件。
请选择声音性别	选择声音的性别，示例：女生。
请选择原始输入语言	选择上传语料所使用的语言，示例：中文。
选择声音领域	声音适用的领域。请根据所选文案样例，选择相应的领域。

勾选形象授权使用说明，单击“提交制作”。

弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量，本次将消耗1个资源。
如果用户确认无误，单击“确认提交”。声音制作任务提交成功后，界面提示“制作任务提交成功”。

模型审核和制作耗时约7个工作日。
用户可以单击“查看制作任务列表”，查看声音制作任务审核进展。

当状态变更为“系统审核完成”，自动启动算法训练。如果系统存在多个算法训练任务，可能会存在排队和延迟的现象，请耐心等待。
确认声音制作任务已训练完成后，在左侧导航栏中，单击“资产管理 > 我的模型”。
选择“声音 > 已激活”页签，找到已生成的声音，单击声音卡片中的头像，即可试听声音效果。

图2 声音