创建Flexus分身数字人定制任务
本节提供MetaStudio服务Flexus数字人及其声音的制作过程。
支持极速制作和非极速制作Flexus形象数字人,详情如下所示:
- 如果是极速制作Flexus形象数字人,勾选“极速制作数字人”即可实现,数字人制作时长约20分钟(不含排队时间),适合需要快速生成数字人的场景。
- 如果是非极速制作Flexus形象数字人,不勾选“极速制作数字人”即可,数字人制作时长约3小时(不含排队时间),口播效果更好。
注意事项
- Flexus形象制作限制,如Flexus形象制作限制所示。
- Flexus支持通过API集成使用,详见接口创建分身数字人模型训练任务的is_flexus字段。
操作步骤
- 登录MetaStudio控制台,进入MetaStudio服务概览页面。
- 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。
- 单击“Flexus分身数字人”,进入Flexus分身数字人流程介绍页面,如图1所示。
- 单击“下一步”,进入Flexus分身数字人制作页面,如图2所示。
界面操作详情,如表1所示。
表1 界面操作说明 参数
说明
训练视频
从本地上传已录制好,且符合拍摄要求的真人实景视频,训练生成Flexus数字人形象和Flexus声音。
- 如果是极速制作Flexus形象数字人,目前仅支持分辨率1080P且时长在1~2分钟内的视频,支持MP4、三通道MOV格式的视频。
- 如果是非极速制作Flexus形象数字人,录制的视频时长1~5分钟,建议2分钟。分辨率需1080P或4K且宽高比应为16:9(横屏)或9:16(竖屏)。
训练生成的分身数字人形象与真人形象完全相同。
极速制作数字人
如果勾选“极速制作数字人”,会加快生成数字人,耗时约20分钟,不勾选则耗时约3小时,这里的时间均不含排队时间。
声音模型制作语料类型
Flexus分身数字人制作任务会同时生成一个Flexus形象和一个Flexus声音,所以也需要提供音频。
- 单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。
- 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。
须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。
数字人名称
生成的Flexus数字人名称。
示例:云笙。
声音性别
选择声音的性别,男声或女声。
联系方式
请输入有效的11位手机号码。
身份证照片
需要分别上传身份证人像面和国徽面的照片。
- 单击“点击上传人像面”,从本地选择身份证人像面照片上传。
- 单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。
形象声音授权
上传形象授权书。
操作如下所示:
- 单击“授权书模板”,将授权书模板下载本地。
- 打印授权书,由身份证本人完成签署操作。
- 扫描文件生成pdf文件,或拍摄文件生成jpg、jpeg、png格式的图片。
- 单击“上传授权书”,从本地选择pdf、jpg、jpeg或png格式的授权书上传。
授权书内容,可参考授权书。
- 勾选“我确认训练推理所使用的形象/声音已得到对应自然人授权,不存在版权纠纷”后,单击“提交制作”,等待数据上传完成后,界面提示“制作任务提交成功!”。
如果不含排队时间,极速制作Flexus形象数字人耗时约20分钟,非极速制作耗时约3小时。图3 制作任务提交成功