文档首页/ 数字内容生产线 MetaStudio/ API参考/ 资产管理/ 数字资产管理/ 创建资产 - CreateDigitalAsset

更新时间：2026-01-29 GMT+08:00

查看PDF

创建资产 - CreateDigitalAsset

功能介绍

该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括：分身数字人模型、背景图片、素材图片、素材视频、PPT等。

上传的图片、视频和背景图片，如果需要在视频制作素材中可见，需要设置system_properties。

资产类型是IMAGE时，通过system_properties来区分背景图片（BACKGROUND_IMG）、素材图片（MATERIAL_IMG）。
资产类型是VIDEO时，通过system_properties来区分素材视频（MATERIAL_VIDEO）、名片视频（BUSSINESS_CARD_VIDEO）。

MetaStudio平台生成的视频，system_properties带CREATED_BY_PLATFORM。

接口约束

不同资产类型主文件格式与大小约束如下

视频资产：资产类型为VIDEO，主文件格式（忽略大小写）为mp4、m4v、mkv、mov、flv、3gp、wmv、avi、webm，主文件大小不超过5G

图片资产：资产类型为IMAGE，主文件格式（忽略大小写）为jpeg、jpg、png、bmp、gif，主文件大小不超过50M

背景音乐资产：资产类型为MUSIC，主文件格式（忽略大小写）为wav,mp3,m4a，主文件大小不超过100M

音频资产：资产类型为AUDIO，主文件格式（忽略大小写）为wav,mp3,m4a，主文件大小不超过100M

幻灯片资产：资产类型为PPT，主文件格式（忽略大小写）为ppt、pptx和pdf，主文件大小不超过100M

调用方法

请参见如何调用API。

授权信息

账号具备所有API的调用权限，如果使用账号下的IAM用户调用当前API，该IAM用户需具备调用API所需的权限，具体权限要求请参见权限和授权项。

URI

POST /v1/{project_id}/digital-assets

表1 路径参数
参数	是否必选	参数类型	描述
project_id	是	String	项目ID，获取方法请参考获取项目ID。

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	否	String	用户Token。使用Token鉴权方式时必选。通过调用IAM服务获取用户Token接口获取。响应消息头中X-Subject-Token的值。
Authorization	否	String	使用AK/SK方式认证时必选，携带的鉴权信息。
X-Sdk-Date	否	String	使用AK/SK方式认证时必选，请求的发生时间。格式为(YYYYMMDD'T'HHMMSS'Z')。
X-App-UserId	否	String	第三方用户ID。不允许输入中文。
X-MSS-Authorization	否	String	数字人内部token

表3 请求Body参数
参数	是否必选	参数类型	描述
asset_name	是	String	参数解释：资产名称。约束限制：不涉及。取值范围：只能使用中英文字符，字符长度0-256位。默认取值：不涉及。
asset_description	否	String	参数解释：资产描述。约束限制：不涉及。取值范围：只能使用中英文字符，字符长度0-4096位。默认取值：不涉及。
asset_type	是	String	参数解释：资产类型。约束限制： VOICE_MODEL，HUMAN_MODEL_2D 普通用户均无法上传。取值范围：公共资产类型： VOICE_MODEL：音色模型 VIDEO：视频文件 IMAGE：图片文件 PPT：幻灯片文件 MUSIC: 音乐 AUDIO: 音频 COMMON_FILE：通用文件分身数字人资产： HUMAN_MODEL_2D: 分身数字人模型 BUSINESS_CARD_TEMPLET: 数字人名片模板默认取值：不涉及。
review_config	否	ReviewConfig object	内容审核配置。
tags	否	Array of strings	参数解释：标签列表。说明：分身形象系统资产的tag定义如下：行业：NEWS,BUSINESS,E_COMMERCE,MARKETING,KNOWLEDGE,EDUCATION,MEDICAL,SPORTS 性别：MALE,FEMALE 姿势：FULL_BODY,HALF_BODY,STANDING,SITTING,FRONT_PHOTO,SIDE_PHOTO 区域：ASIAN,WESTERN,MIDDLE_EASTERNER,AFRICAN,LATINO 约束限制：不涉及取值范围：标签个数最大为50个。标签内容为中英文，字符长度0-128位。默认取值：不涉及
asset_extra_meta	否	AssetExtraMeta object	参数解释：资产额外元数据。约束限制：根据asset_type选择对应结构填写，填写其他不匹配的结构会被忽略。 HUMAN_MODEL_2D: 填写human_model_2d_meta MATERIAL：填写material_meta VOICE_MODEL：填写voice_model_meta VIDEO：填写video_meta IMAGE：填写image_meta PPT：填写ppt_meta AUDIO: 填写audio_meta
system_properties	否	Array of SystemProperty objects	参数解释：设置系统属性。内部参数，普通用户无需设置。约束限制：不涉及取值范围：个数最大为50个。默认取值：不涉及
shared_config	否	AssetSharedConfig object	参数解释：资产共享配置。约束限制：当前仅用于直播模板分享连带的资产共享。取值范围：不涉及默认取值：不涉及
is_need_generate_cover	否	Boolean	参数解释：是否需要生成封面。约束限制：仅用于视频类资产。取值范围： true：自动生成封面。 false：不自动生成封面。默认取值： false
asset_order	否	Integer	参数解释：用于console控制台展示顺序。如果取值相同，则默认最新的排在前面。约束限制：不涉及默认取值：不涉及取值范围： 0~32767
supported_service	否	Array of strings	支持的业务类型。 VIDEO_2D：分身数字人视频制作 LIVE_2D：分身数字人直播 CHAT_2D：分身数字人智能交互
auto_operation_config	否	Array of AutoOperationConfig objects	资产自动处理任务。

表4 ReviewConfig
参数	是否必选	参数类型	描述
no_need_review	否	Boolean	免审核。目前仅白名单用户可使用此参数，非白名单用户跟随系统策略审核。

表5 AssetExtraMeta
参数	是否必选	参数类型	描述
voice_model_meta	否	VoiceModelAssetMeta object	音色模型元数据。
ppt_meta	否	PPTAssetMeta object	PPT资产元数据信息。
material_meta	否	MaterialAssetMeta object	素材元数据。
human_model_2d_meta	否	HumanModel2DAssetMeta object	分身模型元数据
image_meta	否	ImageAssetMeta object	图片元数据
video_meta	否	VideoAssetMeta object	视频元数据，自动提取获得。
audio_meta	否	AudioAssetMeta object	音频元数据，自动提取获得。

表6 VoiceModelAssetMeta
参数	是否必选	参数类型	描述
order	否	Integer	参数解释：展示顺序。约束限制：不涉及。取值范围： 0~32767 默认取值： 999
model_type	否	String	参数解释：声音资产类型。约束限制：不涉及。取值范围： COMMON：通用情感模型 CLONE：语音克隆模型默认取值： CLONE
sex	否	String	参数解释：声音性别。约束限制：不涉及。取值范围： UNKNOW：未知性别声音 MALE：男性声音 FEMALE：女性声音默认取值： UNKNOW
language	否	String	参数解释：声音语言。约束限制：不涉及。取值范围： UNKNOW：未知 CN：中文 EN：英文 GER：德语 fr：法语 Kr：韩语 por：葡萄牙语 JPN：日语 Ita：意大利语 ESP：西班牙语 DBH：东北话 GT：港台 GXH：广西话 HBH：湖北话 SXH：陕西话 SCH：四川话 YY：粤语 Russian: 俄罗斯语 Filipino: 菲律宾语 Dutch: 荷兰语 Indonesian: 印尼语 Vietnamese: 越南语 Arabic: 阿拉伯语 Turkish: 土耳其语 Malay: 马来语 Thai: 泰语 Finnish: 芬兰语默认取值： UNKNOW
languages	否	Array of strings	参数解释：声音语言。约束限制：不涉及。取值范围： UNKNOW：未知 CN：中文 EN：英文 GER：德语 fr：法语 Kr：韩语 por：葡萄牙语 JPN：日语 Ita：意大利语 ESP：西班牙语 DBH：东北话 GT：港台 GXH：广西话 HBH：湖北话 SXH：陕西话 SCH：四川话 YY：粤语 Russian: 俄罗斯语 Filipino: 菲律宾语 Dutch: 荷兰语 Indonesian: 印尼语 Vietnamese: 越南语 Arabic: 阿拉伯语 Turkish: 土耳其语 Malay: 马来语 Thai: 泰语 Finnish: 芬兰语
speed_ratio	否	Float	参数解释：语速缩放比例。约束限制：不涉及取值范围： 0~100 默认取值： 1
volume_ratio	否	Float	参数解释：音量缩放比例。约束限制：不涉及取值范围： 0~100 默认取值： 1
is_realtime_voice	否	Boolean	参数解释：该音色是否支持实时合成。约束限制：支持实时合成的音色，可以用于直播和智能交互场景。否则只能用于视频制作。取值范围： true: 支持实时合成 false: 不支持实时合成默认取值： true
style	否	String	风格参考
voice_capability	否	VoiceCapability object	音色资产支持的能力集。说明：音色能力集只允许查询，不允许设置
external_voice_meta	否	ExternalVoiceAssetMeta object	第三方TTS音色元数据。
is_support_vc_process	否	Boolean	是否支持vc。默认取值： false
is_support_thai_auto_split	否	Boolean	是否支持泰语文本自动分句。默认取值： false
is_flexus	否	Boolean	是否是Flexus版本声音。默认取值： false
is_enhance_rhythm	否	Boolean	是否增强韵律默认取值： false
age	否	String	音色年龄段：青年、中年、老年

表7 VoiceCapability
参数	是否必选	参数类型	描述
is_support_phoneme_en	否	Boolean	参数解释：该声音是否支持英文音标。约束限制：不涉及取值范围： true: 支持英文音标 false: 不支持英文音标默认取值： false
is_support_phoneme	否	Boolean	参数解释：该声音是否支持中文多音字。约束限制：不涉及取值范围： true: 支持中文多音字 false: 不支持中文多音字默认取值： false
is_support_break_time	否	Boolean	参数解释：该声音是否支持停顿。约束限制：不涉及取值范围： true: 支持停顿 false: 不支持停顿默认取值： false
is_support_break_strength	否	Boolean	参数解释：该声音是否支持韵律。约束限制：不涉及取值范围： true: 支持韵律 false: 不支持韵律默认取值： false
is_support_speed	否	Boolean	参数解释：该声音是否支持全局语速。约束限制：不涉及取值范围： true: 支持全局语速 false: 不支持全局语速默认取值： false
is_support_prosody	否	Boolean	参数解释：该声音是否支持局部语速。约束限制：不涉及取值范围： true: 支持局部语速 false: 不支持局部语速默认取值： false
is_support_ssml_say_as	否	Boolean	参数解释：该声音是否支持SSML的say-as标签。约束限制：不涉及取值范围： true: 支持SSML的say-as标签 false: 不支持SSML的say-as标签默认取值： false
is_support_ssml_sub	否	Boolean	参数解释：该声音是否支持SSML的sub标签。约束限制：不涉及取值范围： true: 支持SSML的sub标签 false: 不支持SSML的sub标签默认取值： false
is_support_word	否	Boolean	参数解释：该声音是否支持连读。约束限制：不涉及取值范围： true: 支持连读 false: 不支持连读默认取值： false
is_support_voice_cache	否	Boolean	是否支持缓存。默认取值： false
conversion_rate	否	Float	参数解释：合成率。约束限制：不涉及取值范围： 0-50 取值范围： 0~50 默认取值： 0.0
conversion_rate_en	否	Float	参数解释：英语的合成率。约束限制：不涉及取值范围： 0-50 取值范围： 0~50 默认取值： 0.0
is_support_srt	否	Boolean	是否支持生成STR字幕文件。默认取值： false

表8 ExternalVoiceAssetMeta
参数	是否必选	参数类型	描述
provider	是	String	第三方TTS供应商类型。 XIMALAYA：喜马拉雅TTS HUAWEI_EI：华为云EI TTS MOBVOI：出门问问 TTS AUDIOX：逻辑智能 TTS SINOVOICE：捷通华声 TTS DATABAKER：标贝 TTS AISPEECH：思必驰 TTS

表9 PPTAssetMeta
参数	是否必选	参数类型	描述
auto_analysis	否	Boolean	参数解释： PPT是否需要自动解析。约束限制：部分过于复杂的PPT或压缩比过高的PPT可能无法解析。超过50页PPT仅转换50页转换的图片无法保证完全还原，需要自行确认。取值范围： true: 自动解析 false: 无需解析默认取值： false
ppt_analysis_status	否	String	参数解释： PPT解析状态。约束限制：不涉及取值范围： INITIALIZE：初始 WAITING：等待 CONVERTING：解析中 FAILED：失败 SUCCEEDED：成功 CANCELED：取消默认取值：不涉及
error_info	否	ErrorResponse object	错误信息
page_count	否	Integer	参数解释： PPT页面总数。约束限制：不涉及取值范围： 0~256 默认取值： 0
pages	否	Array of PPTPageInfo objects	PPT页面图片。

**表10** PPTPageInfo
参数	是否必选	参数类型	描述
page_no	否	Integer	参数解释：页面编号。约束限制：不涉及取值范围： 1~256
file_id	否	String	参数解释：页面对应图片文件ID。约束限制：不涉及取值范围：字符长度1-64位默认取值：不涉及
page_content	否	String	参数解释：页面对应图片文件ID 约束限制：不涉及取值范围：字符长度0-2048位默认取值：不涉及。

**表11** MaterialAssetMeta
参数	是否必选	参数类型	描述
components	否	Array of MaterialComponentInfo objects	可替换的素材组件列表。

**表12** MaterialComponentInfo
参数	是否必选	参数类型	描述
component_name	是	String	素材组件名称。
component_type	是	String	素材组件类型。 CLOTHES：衣服 PANTS：裤子 SHOES：鞋子 HAIR：头发 EYELASH：睫毛 EYEBROW：眉毛
component_desc	否	String	素材组件描述。

**表13** HumanModel2DAssetMeta
参数	是否必选	参数类型	描述
is_action_editable	否	Boolean	参数解释：分身数字人的动作是否可编辑约束限制：不涉及取值范围： true: 动作可编辑 false: 动作不可编辑默认取值： false
is_live_copy	否	Boolean	参数解释：是否是直播间复刻任务约束限制：不涉及取值范围： true: 是直播间复刻任务 false: 不是直播间复刻任务默认取值： false
is_real_background	否	Boolean	参数解释：是否是实景分身数字人约束限制：实景分身数字人不做背景替换。取值范围： true: 实景分身数字人 false: 普通分身数字人，不带背景。默认取值： false
support_live	否	Boolean	参数解释：是否支持直播约束限制：不涉及取值范围： true: 支持直播 false: 不支持直播。默认取值： false
model_version	否	String	参数解释：分身数字人模型版本约束限制：不涉及取值范围： V2: V2版本模型 V3：V3版本模型 V3_2：V3.2版本模型 V3_3：V3.3版本模型默认取值： V2
model_resolution	否	String	参数解释：分身数字人模型分辨率。约束限制：不涉及取值范围： 1080P：1080P。支持1080P及720P的视频输出。 4K：4K。支持4K、1080P及720P的视频输出。默认取值： 1080P
device_names	否	Array of strings	参数解释：已执行编译任务设备类型列表。约束限制：支持走动的数字人，当前仅用于视频制作，不能用于直播和智能交互取值范围：设备名称列表最多16个。设备名称字符长度1-64位。默认取值： false
is_with_action_library	否	Boolean	分身数字人是否带原子动作库。说明：带原子动作库的分身数字人可做动作编排。默认取值： false
action_tag_map	否	Array of ActionTagInfo objects	动作标签映射。
is_flexus	否	Boolean	是否是Flexus版本分身数字人。默认取值： false
voice_asset_id	否	String	形象关联的声音资产ID。

**表14** ActionTagInfo
参数	是否必选	参数类型	描述
action_name_zh	是	String	原子动作中文名称。
action_name_en	是	String	原子动作英文名称。
action_duration	否	Float	动作时长取值范围： 0~100
catalog	否	String	动作分类名称。
file_name	否	String	样例视频文件名，最大长度256，最小长度1。
tag	否	String	动作标签。

**表15** ImageAssetMeta
参数	是否必选	参数类型	描述
codec	否	String	参数解释：图片编码格式。约束限制：用户无需填写，系统自行提取。取值范围：字符长度0-32位。默认取值：不涉及。
width	否	Integer	参数解释：图片宽度。约束限制：用户无需填写，系统自行提取。默认取值：不涉及。取值范围： 0~8196
height	否	Integer	参数解释：图片高度。约束限制：用户无需填写，系统自行提取。默认取值：不涉及。取值范围： 0~8196
size	否	Long	参数解释：图片大小。约束限制：用户无需填写，系统自行提取。默认取值：不涉及。取值范围： 0~9223372036854775807
mode	否	String	参数解释：图片形态。约束限制：用户无需填写，系统自行提取。取值范围： Horizontal：横向 Vertical：纵向默认取值：不涉及。
frame_rate	否	String	参数解释：视频帧率。约束限制：用户无需填写，系统自行提取。取值范围：字符长度0-32位。默认取值：不涉及
duration	否	Integer	参数解释：时长,单位秒。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~86400
error_info	否	ErrorResponse object	错误信息

**表16** VideoAssetMeta
参数	是否必选	参数类型	描述
video_codec	否	String	参数解释：视频编码格式。约束限制：用户无需填写，系统自行提取。取值范围：字符长度0-32位。默认取值：不涉及
width	否	Integer	参数解释：视频画面宽度。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~8196
height	否	Integer	参数解释：视频画面高度。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~8196
frame_rate	否	String	参数解释：视频帧率。约束限制：用户无需填写，系统自行提取。取值范围：字符长度0-32位。默认取值：不涉及
video_bit_rate	否	Integer	参数解释：视频平均码率,单位kbps。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~104857600
duration	否	Integer	参数解释：时长,单位秒。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~86400
audio_codec	否	String	参数解释：音频编码格式。约束限制：用户无需填写，系统自行提取。取值范围：字符长度0-32位。默认取值：不涉及
audio_bit_rate	否	Integer	参数解释：音频平均码率,单位kbps。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~16384
audio_channels	否	Integer	参数解释：音频声道数。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~100
sample	否	Integer	参数解释：采样率,HZ。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~100000
mode	否	String	参数解释：横向画面或纵向画面。约束限制：用户无需填写，系统自行提取。取值范围： Horizontal：横向 Vertical：纵向默认取值：不涉及
video_transcoding_status	否	String	参数解释：视频转码状态。约束限制：用户无需填写，系统自行填写。取值范围： WAITING：等待 TRANSCODING：转码中 FAILED：失败 SUCCEEDED：成功默认取值：不涉及
error_info	否	ErrorResponse object	错误信息

**表17** AudioAssetMeta
参数	是否必选	参数类型	描述
duration	否	Integer	参数解释：时长,单位秒。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~86400
audio_codec	否	String	参数解释：音频编码格式。约束限制：用户无需填写，系统自行提取。取值范围：字符长度0-32位。默认取值：不涉及
audio_bit_rate	否	Integer	参数解释：音频平均码率,单位kbps。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~16384
audio_channels	否	Integer	参数解释：音频声道数。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~100
sample	否	Integer	参数解释：采样率,HZ。约束限制：用户无需填写，系统自行提取。默认取值：不涉及取值范围： 0~100000
error_info	否	ErrorResponse object	错误信息

**表18** ErrorResponse
参数	是否必选	参数类型	描述
error_code	否	String	错误码。
error_msg	否	String	错误描述。

**表19** SystemProperty
参数	是否必选	参数类型	描述
action	否	String	参数解释：操作。约束限制：系统属性仅为系统设置，普通用户无法修改。取值范围： ADD：增加 DELETE：删除默认取值：不涉及
key	否	String	参数解释：系统属性条目。约束限制：系统属性仅为系统设置，普通用户无法修改。取值范围：公共资产属性： BACKGROUND_IMG：视频制作的背景图片。value设置成Yes CREATED_BY_PLATFORM: 是否平台生成。 BACKGROUND_SCENE：视频制作的2D背景场景。value可选Horizontal（横屏）或者Vertical（竖屏）。 MEITUAN_MATERIAL_APPROVED: 美团平台已审核标识，value设置成YES。 IS_CONTROLLED: 是否管控。当前仅用于形象/声音资产。可取值YES。 LIVE_IS_AUTHORIZED：直播业务是否已授权。当前仅用于形象/声音资产，业务授权。可取值YES。 VIDEO_IS_AUTHORIZED：视频制作业务是否已授权。当前仅用于形象/声音资产，业务授权。可取值YES。 CHAT_IS_AUTHORIZED：智能交互业务是否已授权。当前仅用于形象/声音资产，业务授权。可取值YES。分身数字人资产属性： MATERIAL_IMG：素材图片，用作图片图层。value设置成Yes，否则控制台视频制作、直播等界面的贴图区域，将无法看到此图片。 MATERIAL_VIDEO：素材视频，用作视频图层。value设置成Yes，否则控制台视频制作、直播等界面的视频区域，将无法看到此视频。 DIGITAL_HUMAN_2D_VIDEO：分身数字人视频。 BUSINESS_CARD_VIDEO：名片视频。 BUSSINESS_CARD_VIDEO：名片视频(过期) PHOTO_VIDEO：照片数字人视频。默认取值：不涉及
value	否	String	参数解释：系统属性属性值。约束限制：系统属性仅为系统设置，普通用户无法修改。取值范围：字符长度1-1024位默认取值不涉及

**表20** AssetSharedConfig
参数	是否必选	参数类型	描述
shared_type	否	String	共享类型。 PRIVATE: 私有，仅本租户可访问。 PUBLIC: 公开，所有租户可访问。当前仅提供系统资产可公开访问。 SHARED：共享，指定租户可访问。拥有者指定租户可访问。
expire_time	否	String	共享过期时间。默认过期时间为30天，即共享当天+30的23:59:59。
allowed_project_ids	否	Array of strings	允许访问本资产的租户列表。

**表21** AutoOperationConfig
参数	是否必选	参数类型	描述
operation	否	String	BLOCK: 冻结 DELETE：删除
operation_time	否	String	资源过期时间，格式遵循：RFC 3339 如"2025-01-10T00:00:00Z"

响应参数

状态码：200

**表22** 响应Header参数
参数	参数类型	描述
X-Request-Id	String	请求ID。

**表23** 响应Body参数
参数	参数类型	描述
asset_id	String	数字资产ID。
produce_id	String	ai标识ID。

状态码：400

**表24** 响应Body参数
参数	参数类型	描述
error_code	String	错误码。
error_msg	String	错误描述。

请求示例

POST https://{endpoint}/v1/6a6a1f8354f64dd9b9a614def7b59d83/digital-assets

{
  "asset_name" : "云笙模型",
  "asset_description" : "数字人员工",
  "asset_type" : "HUMAN_MODEL_2D",
  "tags" : [ "数字人员工" ]
}

响应示例

状态码：200

成功。

{
  "asset_id" : "93769b5a-c8c6-4692-9c95-53933a1f0c93"
}

状态码：400

请求传参异常，包含错误码及对应描述。

{
  "error_code" : "MSS.00000003",
  "error_msg" : "Invalid parameter"
}

状态码

状态码	描述
200	成功。
400	请求传参异常，包含错误码及对应描述。

错误码

请参见错误码。

父主题：数字资产管理

上一篇：数字资产管理

下一篇：查询资产列表 - ListAssets

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！

系统繁忙，请稍后重试