更新时间:2025-07-16 GMT+08:00
分享

创建Flexus分身数字人定制任务

本节提供MetaStudio服务Flexus数字人及其声音的制作过程。

支持极速制作和非极速制作Flexus形象数字人,详情如下所示:

  • 如果是极速制作Flexus形象数字人,勾选“极速制作数字人”即可实现,数字人制作时长约20分钟(不含排队时间),适合需要快速生成数字人的场景。
  • 如果是非极速制作Flexus形象数字人,不勾选“极速制作数字人”即可,数字人制作时长约3小时(不含排队时间),口播效果更好。

注意事项

操作前准备

用户创建Flexus分身数字人定制任务前,需要准备如下内容:

操作步骤

  1. 登录MetaStudio控制台,进入MetaStudio服务概览页面。
  2. 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。
  3. 单击“Flexus分身数字人”,进入Flexus分身数字人流程介绍页面,如图1所示。

    请认真阅读界面上方的规范和避免出现的问题,并仔细观看下方的形象拍摄视频,了解视频的制作流程和制作要求。
    图1 流程介绍

  4. 单击“下一步”,进入Flexus分身数字人制作页面,如图2所示。

    界面操作详情,如表1所示。
    图2 形象制作页面
    表1 界面操作说明

    参数

    说明

    训练视频

    从本地上传已录制好,且符合拍摄要求的真人实景视频,训练生成Flexus数字人形象和Flexus声音。

    • 如果是极速制作Flexus形象数字人,目前仅支持分辨率1080P且时长在1~2分钟内的视频,支持MP4、三通道MOV格式的视频。
    • 如果是非极速制作Flexus形象数字人,录制的视频时长1~5分钟,建议2分钟。分辨率需1080P或4K且宽高比应为16:9(横屏)或9:16(竖屏)。

      支持MP4、MOV格式的视频,推荐MP4格式。如果是MOV格式视频,支持三通道视频,也支持带有透明通道的视频。

    训练生成的分身数字人形象与真人形象完全相同。

    极速制作数字人

    如果勾选“极速制作数字人”,会加快生成数字人,耗时约20分钟,不勾选则耗时约3小时,这里的时间均不含排队时间。

    声音模型制作语料类型

    Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。

    • 单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。

      音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。

    • 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。

      视频中的语言仅支持中文和英文。

    须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。

    数字人名称

    生成的Flexus数字人名称。

    示例:云笙。

    声音性别

    选择声音的性别,男声或女声。

    联系方式

    请输入有效的11位手机号码。

    身份证照片

    需要分别上传身份证人像面和国徽面的照片。

    • 单击“点击上传人像面”,从本地选择身份证人像面照片上传。
    • 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。

    形象声音授权

    上传形象授权书。

    操作如下所示:

    1. 单击“授权书模板”,将授权书模板下载本地。
    2. 打印授权书,由身份证本人完成签署操作。
    3. 扫描文件生成pdf文件,或拍摄文件生成jpg、jpeg、png格式的图片。
    4. 单击“上传授权书”,从本地选择pdf、jpg、jpeg或png格式的授权书上传。

    授权书内容,可参考授权书

  5. 勾选“我确认训练推理所使用的形象/声音已得到对应自然人授权,不存在版权纠纷”后,单击“提交制作”,等待数据上传完成后,界面提示“制作任务提交成功!”。

    如果不含排队时间,极速制作Flexus形象数字人耗时约20分钟,非极速制作耗时约3小时。
    图3 制作任务提交成功

相关文档