文档首页/ 数字内容生产线 MetaStudio/ 用户指南/ Flexus分身数字人/ 创建Flexus分身数字人定制任务

更新时间：2025-07-16 GMT+08:00

创建Flexus分身数字人定制任务

本节提供MetaStudio服务Flexus数字人及其声音的制作过程。

支持极速制作和非极速制作Flexus形象数字人，详情如下所示：

如果是极速制作Flexus形象数字人，勾选“极速制作数字人”即可实现，数字人制作时长约20分钟（不含排队时间），适合需要快速生成数字人的场景。
如果是非极速制作Flexus形象数字人，不勾选“极速制作数字人”即可，数字人制作时长约3小时（不含排队时间），口播效果更好。

注意事项

Flexus形象制作限制，如Flexus形象制作限制所示。
Flexus支持通过API集成使用，详见接口创建分身数字人模型训练任务的is_flexus字段。

操作前准备

用户创建Flexus分身数字人定制任务前，需要准备如下内容：

1~5分钟的真人实景拍摄视频，详见Flexus分身数字人形象采集指南。
身份证正反面照片。
形象授权签署文件，如授权书所示。

操作步骤

登录MetaStudio控制台，进入MetaStudio服务概览页面。
单击“前往MetaStudio工作台”，进入MetaStudio工作台页面。
单击“Flexus分身数字人”，进入Flexus分身数字人流程介绍页面，如图1所示。

请认真阅读界面上方的规范和避免出现的问题，并仔细观看下方的形象拍摄视频，了解视频的制作流程和制作要求。
图1 流程介绍

单击“下一步”，进入Flexus分身数字人制作页面，如图2所示。

界面操作详情，如表1所示。

图2 形象制作页面

表1 界面操作说明
参数	说明
训练视频	从本地上传已录制好，且符合拍摄要求的真人实景视频，训练生成Flexus数字人形象和Flexus声音。如果是极速制作Flexus形象数字人，目前仅支持分辨率1080P且时长在1~2分钟内的视频，支持MP4、三通道MOV格式的视频。如果是非极速制作Flexus形象数字人，录制的视频时长1~5分钟，建议2分钟。分辨率需1080P或4K且宽高比应为16:9（横屏）或9:16（竖屏）。支持MP4、MOV格式的视频，推荐MP4格式。如果是MOV格式视频，支持三通道视频，也支持带有透明通道的视频。训练生成的分身数字人形象与真人形象完全相同。
极速制作数字人	如果勾选“极速制作数字人”，会加快生成数字人，耗时约20分钟，不勾选则耗时约3小时，这里的时间均不含排队时间。
声音模型制作语料类型	Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音，所以也需要提供音频。单独上传语料包：单独录制音频文件，需要单击下方的“点击上传音频文件”，上传音频。音频格式支持WAV、MP3，单段音频时长1~5分钟，建议1分钟。语料中的语言仅支持中文和英文。视频中提取声音：直接提取训练视频中的声音，训练生成Flexus声音。视频中的语言仅支持中文和英文。须知：“单独上传语料包”的方式生成Flexus声音的效果会更好。
数字人名称	生成的Flexus数字人名称。示例：云笙。
声音性别	选择声音的性别，男声或女声。
联系方式	请输入有效的11位手机号码。
身份证照片	需要分别上传身份证人像面和国徽面的照片。单击“点击上传人像面”，从本地选择身份证人像面照片上传。单击“点击上传国徽面”，从本地选择身份证国徽面照片上传。
形象声音授权	上传形象授权书。操作如下所示：单击“授权书模板”，将授权书模板下载本地。打印授权书，由身份证本人完成签署操作。扫描文件生成pdf文件，或拍摄文件生成jpg、jpeg、png格式的图片。单击“上传授权书”，从本地选择pdf、jpg、jpeg或png格式的授权书上传。授权书内容，可参考授权书。

勾选“我确认训练推理所使用的形象/声音已得到对应自然人授权，不存在版权纠纷”后，单击“提交制作”，等待数据上传完成后，界面提示“制作任务提交成功！”。

如果不含排队时间，极速制作Flexus形象数字人耗时约20分钟，非极速制作耗时约3小时。
图3 制作任务提交成功

父主题： Flexus分身数字人

上一篇：Flexus分身数字人形象采集指南

下一篇：查看Flexus分身数字人形象和声音

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问