更新时间:2024-10-23 GMT+08:00
分享

照片数字人限制

照片数字人视频制作限制说明,如表1所示。

表1 照片数字人视频制作限制

照片数字人视频制作配置

限制

人像照片

制作照片数字人的人像照片拍摄要求,如下所示:

  • 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。
  • 五官清晰无遮挡,目视前方。
  • 良好的亮度,确保面部细节。
  • 照片内不能出现多张人脸。

人像照片格式要求,如下所示:

  • 支持的格式为:PNGJPGJPEGWEBP
  • 大小不超过16MB
  • 分辨率最大支持1080P,如果超出,会自动缩放为1080P,且需保证分辨率大于等于80*80。

音频

音频录制要求,如下所示:

  • 单声道音频。
  • 清晰人声无背景音乐与杂音。

音频格式要求,如下所示:

  • 支持的格式为:MP3WAV
  • 大小不超过20MB,时长不超过5分钟。

文本驱动

文本驱动方式的要求如下所示:

  • 文本输入长度不超过2000字。
  • 通过文本合成的音频时长不能超过5分钟。

    在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。

相关文档