文档首页/ 数字内容生产线 MetaStudio/ 用户指南/ 声音制作/ 创建声音制作任务（自研模型）

更新时间：2025-09-04 GMT+08:00

查看PDF

创建声音制作任务（自研模型）

MetaStudio已经预置了各种类型的声音，可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求，可使用自研模型自定义生成声音。

操作限制

MetaStudio不支持个人用户定制声音，仅支持企业用户。

操作前准备

用户创建声音制作任务前，需要参考操作步骤准备如下内容：

使用“语料上传”方式上传语音文件前，需参考声音制作页面的“录音指导”，提前录制好音频。

操作视频

本视频介绍华为云MetaStudio的声音模型训练功能，指导用户在控制台进行声音模型训练，生成数字人声音。

操作步骤

登录MetaStudio控制台，进入MetaStudio服务概览页面。
单击“前往MetaStudio工作台”，进入MetaStudio工作台页面。

单击“声音模型训练”卡片，进入声音制作页面。

界面左侧是声音制作页面，右侧为声音制作流程。
图1 定制声音

在“华为模型”页签，配置声音制作参数。

界面操作详情，如表1所示。

表1 界面操作说明
区域	说明
声音制作	声音制作需整段录制生成一个WAV或MP3格式的音频文件，时长10~30分钟，建议15分钟。声音制作方式后面会展示剩余次数，需要保证剩余次数充足。录制过程中，每句之间有2~3秒的停顿。
请完善声音信息	输入声音名称。示例：欢快女声。
请制作声音	制作声音的方式为“语料上传”。界面提供录音指导，需要按照指导录制生成一个WAV或MP3格式的音频文件。 WAV或MP3格式文件支持直接上传，无需压缩，无需携带文案txt文件。如果未使用服务预置文案，声音标签仅作为标签，来区分声音使用场景。
请选择声音性别	声音的性别，用于匹配声音模型的精准度。如下所示：男生女生
请选择原始输入语言	上传语料所使用的语言。包含如下语言：中文英文须知：当前参数配置仅作为标识，对训练结果没有任何影响。
选择声音领域	声音适用的领域。用户选择声音时，可以通过领域快速筛选匹配音色。系统针对不同领域预置了不同风格的文本，声音训练完成后，可以在“资产管理 > 我的模型 > 声音”页签，试听当前音色在所选领域的文本播报效果。针对上述标签，MetaStudio服务预置了相应的文案内容，如文案样例（进阶版）所示。如果使用预置文案，必须选对标签。

勾选声音授权使用说明，单击“提交制作”。

弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量，本次将消耗1个资源。
如果用户确认无误，单击“确认提交”。

声音制作任务提交成功后，界面提示“制作任务提交成功”，如图2所示。

模型审核和制作耗时约7个工作日。
- 图2 制作任务提交成功
用户可以单击“查看制作任务列表”，查看声音制作任务审核进展。

当状态变更为“系统审核完成”，自动启动算法训练。如果系统存在多个算法训练任务，可能会存在排队和延迟的现象，请耐心等待。

父主题： 声音制作

上一篇：声音录制指导文档下载

下一篇：创建声音制作任务（第三方模型）

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消