创建照片分身数字人视频制作任务
功能介绍
该接口用于创建照片分身数字人视频制作任务。
调用方法
请参见如何调用API。
URI
POST /v1/{project_id}/photo-digital-human-videos
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
project_id |
是 |
String |
[项目ID,获取方法请参考获取项目ID。](tag:hc,hk) |
请求参数
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
X-Auth-Token |
否 |
String |
用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。 响应消息头中X-Subject-Token的值。 |
Authorization |
否 |
String |
使用AK/SK方式认证时必选,携带的鉴权信息。 |
X-Sdk-Date |
否 |
String |
使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。 |
X-Project-Id |
否 |
String |
使用AK/SK方式认证时必选,携带项目ID信息。 |
X-App-UserId |
否 |
String |
第三方用户ID。不允许输入中文。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
script_id |
否 |
String |
剧本ID。 说明:
|
human_image |
是 |
String |
人物照片,需要Base64编码。照片分辨率不超过1080P。 |
voice_config |
否 |
VoiceConfig object |
音色配置。 |
video_config |
否 |
PhotoVideoConfig object |
视频输出配置。 |
shoot_scripts |
是 |
Array of ShootScriptItem objects |
剧本列表。照片数字人仅支持传入一个剧本shoot_script,剧本参数仅支持shoot_script.script_type、shoot_script.text_config; |
output_asset_config |
是 |
OutputAssetConfig object |
输出资产信息配置。 |
background_music_config |
否 |
BackgroundMusicConfig object |
背景音乐配置。 |
review_config |
否 |
ReviewConfig object |
内容审核配置 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
voice_asset_id |
是 |
String |
音色资产ID。 |
speed |
否 |
Integer |
语速。 默认值100,最小值50,最大值200。 说明:
|
pitch |
否 |
Integer |
音高。 默认值100,最小值50,最大值200。 |
volume |
否 |
Integer |
音量。 默认值140,最小值90,最大值240。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
codec |
是 |
String |
视频编码格式及视频文件格式。
|
bitrate |
否 |
Integer |
输出平均码率。 单位:kbps。 最小值40,最大值30000。 |
frame_rate |
否 |
String |
帧率。 单位:FPS。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
sequence_no |
否 |
Integer |
剧本序号。 |
shoot_script |
是 |
ShootScript object |
表演脚本。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
script_type |
否 |
String |
脚本类型,即视频制作的驱动方式。默认TEXT
|
text_config |
否 |
TextConfig object |
讲解词配置。 |
animation_config |
否 |
Array of AnimationConfig objects |
动作配置。 说明:
|
background_config |
否 |
Array of BackgroundConfigInfo objects |
背景配置。 |
emotion_config |
否 |
Array of EmotionConfig objects |
情感标签配置。 说明:
|
layer_config |
否 |
Array of LayerConfig objects |
图层配置。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
text |
是 |
String |
台词脚本。 支持两种模式,纯文本模式和标签模式。 纯文本模式 纯文本模式,使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式 SSML标签的详细定义请参考文本驱动SSML定义。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
background_type |
是 |
String |
背景类型。
|
background_config |
否 |
String |
背景文件的URL。 说明:
|
background_color_config |
否 |
String |
纯色背景的RGB颜色值。 说明:
|
background_asset_id |
否 |
String |
背景资产ID。 说明:
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
emotion |
否 |
String |
情感标签配置。
默认HAPPY。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
layer_type |
是 |
String |
图层类型。
|
asset_id |
否 |
String |
图层所需资产的资产id,外部资产信息无需填写 |
group_id |
否 |
String |
多场景素材编组。同一group_id的素材,在应用全局时共享位置信息。 |
position |
否 |
LayerPositionConfig object |
图层位置配置。 |
size |
否 |
LayerSizeConfig object |
图层大小配置。 |
image_config |
否 |
ImageLayerConfig object |
素材图片图层配置。 |
video_config |
否 |
VideoLayerConfig object |
素材视频图层配置。 |
text_config |
否 |
TextLayerConfig object |
素材文字图层配置。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
dx |
是 |
Integer |
图层左上角像素点的X轴位置值(画布左上角坐标是0x0)。 说明:
|
dy |
是 |
Integer |
图层图片左上角像素点的Y轴位置值(画布左上角坐标是0x0)。 说明:
横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 |
layer_index |
是 |
Integer |
图片/视频/人物图的层顺序。 说明:
|
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
width |
否 |
Integer |
图层图片宽度像素值(相对画布大小)。 说明:
横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 |
height |
否 |
Integer |
图层图片高度像素值(相对画布大小)。 说明:
横屏(16:9)画布像素为1920x1080;竖屏(9:16)画布像素为1080x1920。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
video_url |
否 |
String |
视频文件的URL。 |
video_cover_url |
否 |
String |
视频封面文件的URL。 |
loop_count |
否 |
Integer |
循环播放视频次数。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
text_context |
否 |
String |
文字图层的文本,内容需做Base64编码。 示例:若想添加文字水印“测试文字水印”,那么text_context的值为:5rWL6K+V5paH5a2X5rC05Y2w |
font_name |
否 |
String |
字体。当前支持的字体:
|
font_size |
否 |
Integer |
字体大小(像素)。 取值范围:[4, 120] |
font_color |
否 |
String |
字体颜色。RGB颜色值。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
asset_name |
是 |
String |
输出视频资产名称。 |
is_preview_video |
否 |
Boolean |
是否是预览视频。如果是预览视频不存资产库。 说明:
|
响应参数
状态码: 200
参数 |
参数类型 |
描述 |
---|---|---|
X-Request-Id |
String |
请求ID。 |
参数 |
参数类型 |
描述 |
---|---|---|
job_id |
String |
任务ID。 |
状态码: 400
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
错误码。 |
error_msg |
String |
错误描述。 |
状态码: 401
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
错误码。 |
error_msg |
String |
错误描述。 |
状态码: 500
参数 |
参数类型 |
描述 |
---|---|---|
error_code |
String |
错误码。 |
error_msg |
String |
错误描述。 |
请求示例
POST https://{endpoint}/v1/0d697589d98091f12f92c0073501cd79/photo-digital-human-videos { "voice_config" : { "voice_asset_id" : "394f3a27cd0b3d6164ca75c3db1edf6c", "speed" : 100, "pitch" : 100, "volume" : 140 }, "shoot_scripts" : [ { "sequence_no" : 0, "shoot_script" : { "text_config" : { "text" : "大家好,我是云玲。" } } } ], "video_config" : { "codec" : "H264" }, "output_asset_config" : { "asset_name" : "云玲自我介绍" } }
响应示例
状态码: 200
处理成功返回。
{ "job_id" : "26f06524-4f75-4b3a-a853-b649a21aaf66" }
状态码: 400
{ "error_code" : "MSS.00000003", "error_msg" : "Invalid parameter" }
状态码: 401
{ "error_code" : "MSS.00000001", "error_msg" : "Unauthorized" }
状态码: 500
{ "error_code" : "MSS.00000004", "error_msg" : "Internal Error" }
SDK代码示例
SDK代码示例如下。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 |
package com.huaweicloud.sdk.test; import com.huaweicloud.sdk.core.auth.ICredential; import com.huaweicloud.sdk.core.auth.BasicCredentials; import com.huaweicloud.sdk.core.exception.ConnectionException; import com.huaweicloud.sdk.core.exception.RequestTimeoutException; import com.huaweicloud.sdk.core.exception.ServiceResponseException; import com.huaweicloud.sdk.metastudio.v1.region.MetaStudioRegion; import com.huaweicloud.sdk.metastudio.v1.*; import com.huaweicloud.sdk.metastudio.v1.model.*; import java.util.List; import java.util.ArrayList; public class CreatePhotoDigitalHumanVideoSolution { public static void main(String[] args) { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security. // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment String ak = System.getenv("CLOUD_SDK_AK"); String sk = System.getenv("CLOUD_SDK_SK"); String projectId = "{project_id}"; ICredential auth = new BasicCredentials() .withProjectId(projectId) .withAk(ak) .withSk(sk); MetaStudioClient client = MetaStudioClient.newBuilder() .withCredential(auth) .withRegion(MetaStudioRegion.valueOf("<YOUR REGION>")) .build(); CreatePhotoDigitalHumanVideoRequest request = new CreatePhotoDigitalHumanVideoRequest(); CreatePhotoDigitalHumanVideoReq body = new CreatePhotoDigitalHumanVideoReq(); OutputAssetConfig outputAssetConfigbody = new OutputAssetConfig(); outputAssetConfigbody.withAssetName("云玲自我介绍"); TextConfig textConfigShootScript = new TextConfig(); textConfigShootScript.withText("大家好,我是云玲。"); ShootScript shootScriptShootScripts = new ShootScript(); shootScriptShootScripts.withTextConfig(textConfigShootScript); List<ShootScriptItem> listbodyShootScripts = new ArrayList<>(); listbodyShootScripts.add( new ShootScriptItem() .withSequenceNo(0) .withShootScript(shootScriptShootScripts) ); PhotoVideoConfig videoConfigbody = new PhotoVideoConfig(); videoConfigbody.withCodec(PhotoVideoConfig.CodecEnum.fromValue("H264")); VoiceConfig voiceConfigbody = new VoiceConfig(); voiceConfigbody.withVoiceAssetId("394f3a27cd0b3d6164ca75c3db1edf6c") .withSpeed(100) .withPitch(100) .withVolume(140); body.withOutputAssetConfig(outputAssetConfigbody); body.withShootScripts(listbodyShootScripts); body.withVideoConfig(videoConfigbody); body.withVoiceConfig(voiceConfigbody); request.withBody(body); try { CreatePhotoDigitalHumanVideoResponse response = client.createPhotoDigitalHumanVideo(request); System.out.println(response.toString()); } catch (ConnectionException e) { e.printStackTrace(); } catch (RequestTimeoutException e) { e.printStackTrace(); } catch (ServiceResponseException e) { e.printStackTrace(); System.out.println(e.getHttpStatusCode()); System.out.println(e.getRequestId()); System.out.println(e.getErrorCode()); System.out.println(e.getErrorMsg()); } } } |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 |
# coding: utf-8 from huaweicloudsdkcore.auth.credentials import BasicCredentials from huaweicloudsdkmetastudio.v1.region.metastudio_region import MetaStudioRegion from huaweicloudsdkcore.exceptions import exceptions from huaweicloudsdkmetastudio.v1 import * if __name__ == "__main__": # The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security. # In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = __import__('os').getenv("CLOUD_SDK_AK") sk = __import__('os').getenv("CLOUD_SDK_SK") projectId = "{project_id}" credentials = BasicCredentials(ak, sk, projectId) \ client = MetaStudioClient.new_builder() \ .with_credentials(credentials) \ .with_region(MetaStudioRegion.value_of("<YOUR REGION>")) \ .build() try: request = CreatePhotoDigitalHumanVideoRequest() outputAssetConfigbody = OutputAssetConfig( asset_name="云玲自我介绍" ) textConfigShootScript = TextConfig( text="大家好,我是云玲。" ) shootScriptShootScripts = ShootScript( text_config=textConfigShootScript ) listShootScriptsbody = [ ShootScriptItem( sequence_no=0, shoot_script=shootScriptShootScripts ) ] videoConfigbody = PhotoVideoConfig( codec="H264" ) voiceConfigbody = VoiceConfig( voice_asset_id="394f3a27cd0b3d6164ca75c3db1edf6c", speed=100, pitch=100, volume=140 ) request.body = CreatePhotoDigitalHumanVideoReq( output_asset_config=outputAssetConfigbody, shoot_scripts=listShootScriptsbody, video_config=videoConfigbody, voice_config=voiceConfigbody ) response = client.create_photo_digital_human_video(request) print(response) except exceptions.ClientRequestException as e: print(e.status_code) print(e.request_id) print(e.error_code) print(e.error_msg) |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 |
package main import ( "fmt" "github.com/huaweicloud/huaweicloud-sdk-go-v3/core/auth/basic" metastudio "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/metastudio/v1" "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/metastudio/v1/model" region "github.com/huaweicloud/huaweicloud-sdk-go-v3/services/metastudio/v1/region" ) func main() { // The AK and SK used for authentication are hard-coded or stored in plaintext, which has great security risks. It is recommended that the AK and SK be stored in ciphertext in configuration files or environment variables and decrypted during use to ensure security. // In this example, AK and SK are stored in environment variables for authentication. Before running this example, set environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak := os.Getenv("CLOUD_SDK_AK") sk := os.Getenv("CLOUD_SDK_SK") projectId := "{project_id}" auth := basic.NewCredentialsBuilder(). WithAk(ak). WithSk(sk). WithProjectId(projectId). Build() client := metastudio.NewMetaStudioClient( metastudio.MetaStudioClientBuilder(). WithRegion(region.ValueOf("<YOUR REGION>")). WithCredential(auth). Build()) request := &model.CreatePhotoDigitalHumanVideoRequest{} outputAssetConfigbody := &model.OutputAssetConfig{ AssetName: "云玲自我介绍", } textConfigShootScript := &model.TextConfig{ Text: "大家好,我是云玲。", } shootScriptShootScripts := &model.ShootScript{ TextConfig: textConfigShootScript, } sequenceNoShootScripts:= int32(0) var listShootScriptsbody = []model.ShootScriptItem{ { SequenceNo: &sequenceNoShootScripts, ShootScript: shootScriptShootScripts, }, } videoConfigbody := &model.PhotoVideoConfig{ Codec: model.GetPhotoVideoConfigCodecEnum().H264, } speedVoiceConfig:= int32(100) pitchVoiceConfig:= int32(100) volumeVoiceConfig:= int32(140) voiceConfigbody := &model.VoiceConfig{ VoiceAssetId: "394f3a27cd0b3d6164ca75c3db1edf6c", Speed: &speedVoiceConfig, Pitch: &pitchVoiceConfig, Volume: &volumeVoiceConfig, } request.Body = &model.CreatePhotoDigitalHumanVideoReq{ OutputAssetConfig: outputAssetConfigbody, ShootScripts: listShootScriptsbody, VideoConfig: videoConfigbody, VoiceConfig: voiceConfigbody, } response, err := client.CreatePhotoDigitalHumanVideo(request) if err == nil { fmt.Printf("%+v\n", response) } else { fmt.Println(err) } } |
更多编程语言的SDK代码示例,请参见API Explorer的代码示例页签,可生成自动对应的SDK代码示例。
状态码
状态码 |
描述 |
---|---|
200 |
处理成功返回。 |
400 |
请求传参异常,包含错误码及对应描述。 |
401 |
未鉴权或鉴权失败。 |
500 |
内部服务错误。 |
错误码
请参见错误码。