制作照片数字人视频
支持上传正面清晰的人像照片,生成会说话的照片数字人视频。
操作限制
照片数字人视频制作限制,如照片数字人限制所示。
操作步骤
- 登录MetaStudio控制台。
- 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。
界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
表1 界面操作说明 区域
参数
说明
01 请上传您的照片
人像照片
单击“查看示范”,在弹出的“上传照片要求”对话框中,查看照片拍摄要求。
请严格按照要求拍摄并上传照片。照片格式必须为JPG、JPEG、PNG、WEBP,大小不超过16MB,照片比例推荐16:9或9:16。
视频名称
使用照片人像合成视频名称。
02 录入播报内容
选择一种方式,生成播报内容
提供下述种方式,生成照片数字人播报内容。
播报内容生成后,单击右侧的“试听”,可以试听播报效果。
- 语音上传:本地录制音频后上传。音频格式需要为WAV或MP3格式,音频大小不超过20MB,时长不超过5分钟。
- 在线录音:在线录制音频。录音时长不能超过5分钟,为保证音频生成的效果,请保持录音环境安静无噪音。支持试听录制生成的语音。
- 文本驱动:通过输入文本,选择声音的方式,生成播报内容。不能超过2000字。
- 无标注的系统声音,均为免费声音,可直接选用。
- 标注有“第三方”的声音,需要购买激活后才能使用,操作请参考购买出门问问声音套餐。