网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络 ANC
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts盘古助手
华为云Astro大屏应用
计算
弹性云服务器 ECS
Flexus云服务
裸金属服务器 BMS
云手机服务器 CPH
专属主机 DeH
弹性伸缩 AS
镜像服务 IMS
函数工作流 FunctionGraph
云耀云服务器(旧版)
VR云渲游平台 CVR
Huawei Cloud EulerOS
云化数据中心 CloudDC
网络
虚拟私有云 VPC
弹性公网IP EIP
弹性负载均衡 ELB
NAT网关 NAT
云专线 DC
虚拟专用网络 VPN
云连接 CC
VPC终端节点 VPCEP
企业路由器 ER
企业交换机 ESW
全球加速 GA
企业连接 EC
云原生应用网络 ANC
CDN与智能边缘
内容分发网络 CDN
智能边缘云 IEC
智能边缘平台 IEF
CloudPond云服务
安全与合规
安全技术与应用
Web应用防火墙 WAF
企业主机安全 HSS
云防火墙 CFW
安全云脑 SecMaster
DDoS防护 AAD
数据加密服务 DEW
数据库安全服务 DBSS
云堡垒机 CBH
数据安全中心 DSC
云证书管理服务 CCM
威胁检测服务 MTD
态势感知 SA
认证测试中心 CTC
边缘安全 EdgeSec
大数据
MapReduce服务 MRS
数据湖探索 DLI
表格存储服务 CloudTable
可信智能计算服务 TICS
推荐系统 RES
云搜索服务 CSS
数据可视化 DLV
数据接入服务 DIS
数据仓库服务 GaussDB(DWS)
数据治理中心 DataArts Studio
湖仓构建 LakeFormation
智能数据洞察 DataArts Insight
应用中间件
微服务引擎 CSE
分布式消息服务Kafka版
分布式消息服务RabbitMQ版
分布式消息服务RocketMQ版
API网关 APIG
分布式缓存服务 DCS
多活高可用服务 MAS
事件网格 EG
开天aPaaS
应用平台 AppStage
开天企业工作台 MSSE
开天集成工作台 MSSI
API中心 API Hub
云消息服务 KooMessage
交换数据空间 EDS
云地图服务 KooMap
云手机服务 KooPhone
组织成员账号 OrgID
云空间服务 KooDrive
管理与监管
统一身份认证服务 IAM
消息通知服务 SMN
云监控服务 CES
应用运维管理 AOM
应用性能管理 APM
云日志服务 LTS
云审计服务 CTS
标签管理服务 TMS
配置审计 Config
应用身份管理服务 OneAccess
资源访问管理 RAM
组织 Organizations
资源编排服务 RFS
优化顾问 OA
IAM 身份中心
云运维中心 COC
资源治理中心 RGC
区块链
区块链服务 BCS
数字资产链 DAC
华为云区块链引擎服务 HBS
解决方案
高性能计算 HPC
SAP
混合云灾备
开天工业工作台 MIW
Haydn解决方案工厂
数字化诊断治理专家服务
价格
成本优化最佳实践
专属云商业逻辑
云生态
云商店
合作伙伴中心
华为云开发者学堂
华为云慧通差旅
其他
管理控制台
消息中心
产品价格详情
系统权限
客户关联华为云合作伙伴须知
公共问题
宽限期保留期
奖励推广计划
活动
云服务信任体系能力说明
开发与运维
软件开发生产线 CodeArts
需求管理 CodeArts Req
流水线 CodeArts Pipeline
代码检查 CodeArts Check
编译构建 CodeArts Build
部署 CodeArts Deploy
测试计划 CodeArts TestPlan
制品仓库 CodeArts Artifact
移动应用测试 MobileAPPTest
CodeArts IDE Online
开源镜像站 Mirrors
性能测试 CodeArts PerfTest
应用管理与运维平台 ServiceStage
云应用引擎 CAE
开源治理服务 CodeArts Governance
华为云Astro轻应用
CodeArts IDE
Astro工作流 AstroFlow
代码托管 CodeArts Repo
漏洞管理服务 CodeArts Inspector
联接 CodeArtsLink
软件建模 CodeArts Modeling
Astro企业应用 AstroPro
CodeArts盘古助手
华为云Astro大屏应用
存储
对象存储服务 OBS
云硬盘 EVS
云备份 CBR
高性能弹性文件服务 SFS Turbo
弹性文件服务 SFS
存储容灾服务 SDRS
云硬盘备份 VBS
云服务器备份 CSBS
数据快递服务 DES
云存储网关 CSG
专属分布式存储服务 DSS
数据工坊 DWR
地图数据 MapDS
键值存储服务 KVS
容器
云容器引擎 CCE
云容器实例 CCI
容器镜像服务 SWR
云原生服务中心 OSC
应用服务网格 ASM
华为云UCS
数据库
云数据库 RDS
数据复制服务 DRS
文档数据库服务 DDS
分布式数据库中间件 DDM
云数据库 GaussDB
云数据库 GeminiDB
数据管理服务 DAS
数据库和应用迁移 UGO
云数据库 TaurusDB
人工智能
AI开发平台ModelArts
华为HiLens
图引擎服务 GES
图像识别 Image
文字识别 OCR
自然语言处理 NLP
内容审核 Moderation
图像搜索 ImageSearch
医疗智能体 EIHealth
企业级AI应用开发专业套件 ModelArts Pro
人脸识别服务 FRS
对话机器人服务 CBS
语音交互服务 SIS
人证核身服务 IVS
视频智能分析服务 VIAS
城市智能体
自动驾驶云服务 Octopus
盘古大模型 PanguLargeModels
IoT物联网
设备接入 IoTDA
全球SIM联接 GSL
IoT数据分析 IoTA
路网数字化服务 DRIS
IoT边缘 IoTEdge
设备发放 IoTDP
企业应用
域名注册服务 Domains
云解析服务 DNS
企业门户 EWP
ICP备案
商标注册
华为云WeLink
华为云会议 Meeting
隐私保护通话 PrivateNumber
语音通话 VoiceCall
消息&短信 MSGSMS
云管理网络
SD-WAN 云服务
边缘数据中心管理 EDCM
云桌面 Workspace
应用与数据集成平台 ROMA Connect
ROMA资产中心 ROMA Exchange
API全生命周期管理 ROMA API
政企自服务管理 ESM
视频
实时音视频 SparkRTC
视频直播 Live
视频点播 VOD
媒体处理 MPC
视频接入服务 VIS
数字内容生产线 MetaStudio
迁移
主机迁移服务 SMS
对象存储迁移服务 OMS
云数据迁移 CDM
迁移中心 MGC
专属云
专属计算集群 DCC
开发者工具
SDK开发指南
API签名指南
DevStar
华为云命令行工具服务 KooCLI
Huawei Cloud Toolkit
CodeArts API
云化转型
云架构中心
云采用框架
用户服务
账号中心
费用中心
成本中心
资源中心
企业管理
工单管理
客户运营能力
国际站常见问题
支持计划
专业服务
合作伙伴支持计划
我的凭证
华为云公共事业服务云平台
工业软件
工业数字模型驱动引擎
硬件开发工具链平台云服务
工业数据转换引擎云服务
更新时间:2025-02-13 GMT+08:00
分享

视频直播

用户可以使用分身数字人,创建直播间。

操作前准备

  • 如果系统预置的数字人形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。
  • 推荐使用Chrome浏览器访问MetaStudio控制台。

操作限制

  • MetaStudio控制台预置形象的有效使用期为3年,在2027年的年中前可放心使用。具体下线时间请关注MetaStudio服务,会提前3个月在现网开放下线公告。
  • 视频直播限制,如视频直播限制所示。

操作步骤

  1. 登录MetaStudio控制台
  1. 在“工作台”界面,单击“分身视频直播”下方的“开始创建”。

    进入分身数字人直播首页面,如图1所示。

    图1 分身视频直播首页面

  2. 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。

    界面详情如视频直播界面说明所示,对应操作说明如下所示。详细操作说明,请参考视频直播公共配置

    • 在左侧的素材区域,除了系统预置的视频素材外,角色还可以自定义定制数字人;背景、贴图、视频还支持从本地导入使用;商品可以自主创建;文本可自主输入文字内容。
    • 从素材区域添加到预览窗口中的贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等操作。还支持设置大小,拖动位置。

  3. 视频直播画面创作完成后,请根据实际情况,选择下述一种直播剧本驱动方式。

    “剧本驱动”包含3种方式:

    • 文本驱动

      需要通过文本驱动数字人说话。支持下述2种方式,增加文本内容。

      • 直接在各个场景的段落框中输入文本内容。可单击图标,新增更多的段落。
      • 单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。

      手工输入文本示例,如下所示:

      请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。

      • 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。
      • 段落1.2:我们每个人都有自己的学习和工作,难免会遇到一些问题。当我们遇到问题的时候,应该如何解决的呢?
        图2 文本驱动

      文本内容的操作说明如表1所示。

      不同声音模型对表1中操作的支持情况有差异,所以如果表1中操作项置灰,说明当前声音模型不支持此操作。需要重新选择一个支持所需操作的声音模型进行设置。

      表1 操作说明

      操作

      说明

      插入停顿

      在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。

      多音字

      选中文字,设置多音字的正确读音。

      全局语速

      设置全局语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。

      助播

      选中一段文字,设置为助播来播报这段内容。

      全局声音(主播)

      主播全局声音,适用于直播间所有场景。如果单场景有单独设置声音,优先使用单场景的声音播报。

      有默认声音,用户也可以根据实际情况选择其他声音。

      如果需要使用标注“第三方”的系统声音,请参考购买出门问问声音套餐进行操作。

      全局声音(助播)

      助播全局声音,适用于直播间所有场景。单场景不支持单独设置助播声音。

      开播后的效果,如图3所示。如需进行互动,可单击图标,切换到助播声音。输入并发送互动内容,主播暂停播报,并使用助播声音插播发送成功的互动内容。

      导入

      支持从本地导入文本文件,解析生成段落内容。

      导入文件需满足:

      1. 支持txt格式,且字数不低于200字。
      2. 文本内容根据换行,自动解析为段落。

      试听

      单击“试听”,可以试听当前直播间剧本。

      默认使用全局主播声音播报,如果单场景有单独设置声音,优先使用单场景的声音播报。单独标注助播的内容,会使用全局助播的声音进行播报。

      也可以单击段落区域的试听图标,试听当前段落。

      场景操作

      支持对场景,执行下述操作:

      • :修改场景名称,默认值为“场景1”
      • :设置当前场景播报的声音,直播时会优先使用此声音播报当前场景内容。
      • :复制当前场景,新增一个相同场景。
      • :删除当前场景。
      • :调整场景的位置。
      • :为当前场景新增1个空白段落。

      段落操作

      支持对段落,执行下述操作:

      • :修改段落名称,默认值为“段落1.1”。
      • :试听当前段落的播报效果。
      • :复制当前段落,新增一个相同段落。
      • :删除段落。
      • :调整段落在场景中的位置。
      • :新增1个空白段落。
      图3 开播界面
    • 音频驱动
      1. 单击“上传音频”,从本地上传已录制好的音频,如图4所示。

        每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。

        开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用于开播后,使用主播或助播声音,播报发送的互动内容。

        图4 音频驱动
      2. 音频上传完成后,单击“试听”,可试听音频。
        开播后可单击如图5所示的图标,切换到全局主播或助播的声音,发送互动内容成功后,播报互动内容。
        图5 开播页面

    • 即兴直播

      无需设置剧本,直接开播,界面如图6所示。开播后数字人保持静默,需要发送互动内容或者通过真人接管,驱动数字人说话。

      图6 即兴直播

  4. 如果还需要制作多场景,可以单击直播画面预览窗口右侧“场景1”小窗口下方的“+”图标,新增场景,并参考前一个场景,设置生成下一个场景的画面布局和剧本内容。

    图7 直播间界面

  5. 所有场景的画面布局和剧本设置完成后,单击界面右侧的“互动设置”页签,如图8所示。

    互动设置包含4类设置:弹幕、用户入场、点赞和送礼。支持直接导入互动管理中设置好的互动库,也支持在当前直播间逐条设置互动规则。所有类型总计可添加100个互动规则。

    这4类互动设置新增互动规则的操作基本相同,下面以弹幕为例,进行操作说明。

    图8 互动设置
    1. 单击图8中的“添加规则”,展示如图9所示的界面。

      界面下方新增1个规则设置。

      先设置用户弹幕触发规则的关键词,如果有多个,请以“|”分隔,示例“链接|型号|优惠”。即服务扫描弹幕的时候,如果扫描到此关键词,自动回复当前规则内容。

      在下方选择主播或助播回复用户问题,回复内容支持通过下述2种方式设置。
      • 文本:通过文本方式设置回复内容,最多可增加5条回复。直播间开播后按照触发次数,从前往后依次命中答复,每次仅回复一条文本内容。

        示例:关于产品的链接、型号和优惠等问题,请看界面上方的说明,按照说明操作,就可以详细了解了。

      • 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。
      • 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。

      回复问题的时候,支持同时在直播画面中展示图片或者视频信息,以加强回复效果。图片和视频的添加和设置方式完全相同,下面以图片为例,进行操作说明。

      1. 单击下方的“+”区域框,从本地选择图片或视频,添加到“+”区域框中。

        添加成功后,区域框展示图片缩略图,如所示。

      2. 将鼠标放在区域框中,区域框变化为形式。
      3. 单击“预览”,图片被添加到直播画面预览窗口中,可根据实际情况拖动图片的展示位置或者调整图片大小。
        图9 弹幕设置
    2. 单击“新增”,可参考6.a,添加更多的弹幕回复规则。
    3. 等所有弹幕规则增加完成后,支持单击“新增兜底”,新增新增一条兜底规则,设置方式与6.a相同。

      其含义为:用户问题如果未匹配到已有规则,可触发兜底回复,仅支持设置1条兜底回复。

    4. 支持对已有规则,执行下述操作:
      • 批量管理:支持批量设置所选规则使用的场景,或批量删除所选规则。
      • 弹幕回显:开启“弹幕回显”后,在直播画面中可以看到一条文本信息:正在回复[用户名称]:[弹幕内容]。
      • 全部启用:可以直接“全部启用”所有规则。
      • :设置单规则使用的场景。
      • :启用或关闭当前规则。
      • :删除规则。

  6. 单击界面右侧的“直播配置”页签,如图10所示。

    直播配置说明,如表2所示。
    图10 我的视频
    表2 直播配置

    区域

    参数

    说明

    开播设置

    选择开播方式(二选一)

    请根据实际情况,选择一种开播方式,并按照界面提示进行操作。

    提供下述2种方式开播:

    • 从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。

      推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。

    • 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。

    需要注意:

    • 使用RTMP推流时,关闭控制台页面不等于结束直播任务,画面会持续生成并计费。如需结束直播画面,需手动单击结束直播或通过API下发结束命令。
    • 直播平台的规定及相关政策请自行了解,部分平台可能限制虚拟内容直播。

    输出设置

    直播画面

    选择直播画面的清晰度。

    包含如下选项:

    • 流畅
    • 高清
    • 超清

    默认值:高清。

    播放次数

    设置直播循环播放的次数,或“无限循环”。

    默认播放1次。

    直播窗口

    直播窗口展示尺寸,不同方案均可调整为竖向。

    包含如下选项:

    • 竖屏
    • 全屏:推荐用全屏,捕获的画面更大,需在直播伴侣中旋转使用。

    默认为“竖屏”。

    更多设置

    事件回调地址

    可在直播中返回场景、段落事件的字段,适用于接口调用或客户二次开发使用的场景。

    直播间ID

    无需设置,当前直播间保存后自动展示。

  7. 上述操作完成后,需要单击界面右上角的图标,保存直播内容。
  8. 单击界面右下方的“准备开播”,准备开播。

    默认勾选“加载完自动直播”,单击“准备开播”加载完成后自动开播。

    如果希望延迟开播,先取消勾选“加载完自动直播”,再单击“准备开播”。当需要开播时,在相同位置单击“开始直播”即可启动直播。

    使用即兴直播方式开播,仅需单击“准备开播”即可启动直播。

  9. 文本驱动和音频驱动方式,还需确认风险提示。建议按照系统建议优化完成后,再启动直播。

    1. 弹出“风险提示”对话框,如图11所示。
      用户需要参照风险提示项,逐一核查并优化直播内容。
      图11 风险提示
    2. 用户可以等直播风险消除后再开播,也可以直接选择“承担风险开播”后,等待直播启动。

  10. 直播启动成功后,直播画面预览窗口中,会展示直播启动的进度。

    开播后的效果如图12所示。界面右下方的操作说明,如表3所示。

    图12 开播页面
    表3 界面说明

    界面元素

    说明

    00:01:20

    直播计时,当前已直播1分20秒。

    切换互动内容播报的声音。默认为主播声音,可切换为助播声音。

    单击快捷图标,选择预置的互动内容发送播报。

    请输入互动内容,回车发送内容

    手工输入互动内容,发送成功后,主播或助播进行互动内容插播。插播结束后,继续播报原有内容。

    真人接管

    单击“真人接管”,开启真人接管功能。数字人停止发声,仅保留动作,改由真人发声。

    真人发声结束后,单击“取消真人接管”,关闭真人接管功能,继续播报原有内容。

    暂停

    单击“暂停”,暂停播报。

    单击“继续”,可恢复播报。

    停止

    单击“停止”,关闭当前直播。

相关文档