更新时间:2024-12-04 GMT+08:00

声音制作

MetaStudio支持自定义生成声音。

操作前准备

用户创建声音制作任务前,需要参考操作步骤准备如下内容:

操作步骤

  1. 登录MetaStudio控制台
  1. 单击“声音制作”下方的“开始创建”,进入声音制作页面。

    图1 定制声音

  2. 在“华为模型”页签,配置声音制作参数。

    界面操作详情,如表1所示。
    表1 界面操作说明

    区域

    说明

    声音制作方式

    选择“声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2~3秒的停顿。音频时长10~30分钟,建议15分钟。

    请完善声音信息

    输入声音名称,示例:欢快女声。

    请制作声音

    使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。

    请选择声音性别

    选择声音的性别,示例:女生。

    原始输入语言

    选择上传语料所使用的语言,示例:中文。

    选择声音标签

    声音的标签。请根据所选文案样例,选择相应的标签,如下所示:

    • 营销:营销宣传风格文案
    • 新闻:新闻播报风格文案

  3. 单击“提交制作”。

    弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。

  4. 如果用户确认无误,单击“确认提交”。

    声音制作任务提交成功后,界面提示“制作任务提交成功”,如#metastudio_03_0002/fig12335162042117所示。

    模型审核和制作耗时约7个工作日。

  5. 用户可以单击“查看制作任务列表”,查看声音制作任务审核进展。

    当状态变更为“系统审核完成”,自动启动算法训练。如果系统存在多个算法训练任务,可能会存在排队和延迟的现象,请耐心等待。

  6. 确认声音制作任务已训练完成后,在左侧导航栏中,单击“我的创作”。
  7. 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。

    图2 声音