文字转语音真人发声

收音

收音收音说明 MetaStudio会使用视频中的语音，并结合对应的真人口型变化，训练口型驱动效果，训练结果还会经过专家的技术审核。所以在收音这方面，建议如下：视频的音画必须同步。环境需安静无噪声。模特人声需清晰，无其他人声干扰。尽量减少视频底噪。建议选用小蜜蜂或其他专业

来自：帮助中心

查看更多 →
拍摄真人视频

拍摄真人视频概览相机架设及拍摄规格灯光布置收音模特形象模特表达视频提交父主题：形象制作

来自：帮助中心

查看更多 →
应用场景

应用场景语音客服质检识别客服、客户的语音，转换为文本。进一步通过文本检索，检查有没有违规、敏感词、电话号码等信息。会议记录对会议记录的音频文件，进行快速的识别，转化成文字，方便进行会议记录。语音短消息通过语音发送或者接收短消息时，将音频短消息转文字，提升阅读效率和交互体验。

来自：帮助中心

查看更多 →
上传语音通知的文字转语音模板文件（createVoiceTemplate）

上传语音通知的文字转语音模板文件（createVoiceTemplate）场景描述上传语音通知的文字转语音模板文件。接口方法 POST 接口URI https:// 域名 /apiaccess/rest/cc-management/v1/createVoiceTemplate，例如域名是service

来自：帮助中心

查看更多 →
真人声音录制

真人声音录制客户录制真人音频，上传至MetaStudio进行AI训练，即可得到和真人音色1:1复刻的声音模型。声音模型可实现文本转语音，应用于数字人视频制作、直播、交互问答等场景中。不同版本录制规格如下：基础版：20句，每个音频文件时长约10秒。音频总时长为3~10分钟，建议5分钟。

来自：帮助中心

查看更多 →
是否支持aac格式的语音文件转文字

是否支持aac格式的语音文件转文字一句话识别和录音文件识别以及实时语音识别均可实现语音转文字，一句话识别支持aac格式，录音文件识别和实时语音识别不支持aac格式。父主题：产品咨询类

来自：帮助中心

查看更多 →
功能介绍

针对客户的特定场景需求，定制垂直领域的语音识别模型，识别效果更精确。语音合成语音合成支持多种音色，可调节语调，语速，音量。产品优势多语种多音色中文普通话、男声、女声、童声自由切换，可以调整音量，语速。效果出色文本转换自然清晰，近乎真人发音，能够符合多样的应用场景。

来自：帮助中心

查看更多 →
视频直播

输入互动内容，并发送成功后，主播或助播进行互动内容插播。插播结束后，继续播报原有内容。真人接管单击“真人接管”，开启真人接管功能。数字人停止发声，仅保留动作，改由真人发声。真人发声结束后，单击“取消真人接管”，关闭真人接管功能，继续播报原有内容。暂停单击“暂停”，暂停播报。单击“继续”，可恢复播报。

来自：帮助中心

查看更多 →
算法备案公示

华为云MetaStudio数字人语音驱动算法表1 语音驱动算法算法项描述算法名称华为云MetaStudio数字人语音驱动算法备案编号网信算备520111252474601240061号算法基本原理数字人语音驱动算法是指使用深度学习将语音转换成3D数字人表情和肢体驱动数据的一种技术。

来自：帮助中心

查看更多 →
文字水印

文字水印添加文字水印时使用的参数，包括字体大小、字体类型以及文字颜色等。具体文字水印参数如表1所示。表1 文字水印参数参数取值说明代码样例 text 添加文字水印时的必选参数。须知：必须是URL安全base64编码。encodeText = url_safe_bas

来自：帮助中心

查看更多 →
放音

分支条件介绍表1 分支条件名称含义使用方法放音失败音频/视频/文本转语音/变量音播放失败播放失败时走该分支。典型使用场景语音转IVR流程后，播放欢迎语。 IVR流程执行过程中或者执行结束前，播放语音提示。父主题：图元参考

来自：帮助中心

查看更多 →
对话交互后接口（inaction=9）

5：转接第三方号码 6：在线数字辅助 7：转人工（转熟客，目前仅支持多媒体） 8：转人工（转座席所在技能队列，目前仅支持多媒体） 31：转多媒体留言（转熟客） 32：转多媒体留言（转技能队列） 33：转多媒体留言（转座席） route_value String body True 路由

来自：帮助中心

查看更多 →
对话交互后接口（inaction=9）

5：转接第三方号码 6：在线数字辅助 7：转人工（转熟客，目前仅支持多媒体） 8：转人工（转座席所在技能队列，目前仅支持多媒体） 31：转多媒体留言（转熟客） 32：转多媒体留言（转技能队列） 33：转多媒体留言（转座席） route_value String body True 路由

来自：帮助中心

查看更多 →
放音

分支条件介绍表1 分支条件名称含义使用方法放音失败音频/视频/文本转语音/变量音播放失败播放失败时走该分支。典型使用场景语音转IVR流程后，播放欢迎语。 IVR流程执行过程中或者执行结束前，播放语音提示。父主题：图元

来自：帮助中心

查看更多 →
消息

编辑拍照获取的图片并发送前消息转邮件消息支持一键转邮件，沟通更高效。在消息聊天窗口，长按任意一条消息，点击“多选”，选择需要通过邮件转发的消息，点击右下角“更多”按钮，选择邮件，输入收件人后发送即可。消息转日程长按单条消息，可将消息内容转为日历日程，并可自动识别时间、地点等信息。语音消息转文字

来自：帮助中心

查看更多 →
文字识别

None 服务介绍文字识别 OCR 文字识别技术简介 01:46 文字识别技术简介快速入门文字识别 OCR 使用SDK 06:38 SDK使用指导文字识别 OCR 使用API 03:04 API使用指导问题排查文字识别 OCR 获取Token 时帐密报错 03:53 获取Token时帐密报错

来自：帮助中心

查看更多 →
文字识别

文字识别文字识别连接器用于对接华为云文字识别服务，可以通过文字识别服务准确识别图像中的文字。前提条件使用文字识别连接器前，需要开通华为云文字识别服务。创建文字识别连接登录新版ROMA Connect控制台。在左侧导航栏选择“连接器”，在连接器页面单击“新建连接”。选择“华为云服务”类别下的“文字识别”。

来自：帮助中心

查看更多 →
方案概述

相比，虚拟数字人系统具有更高的人性化和情感化表现，更加接近真人的交互方式，能够更好地满足人类的需求和期望。相比传统的文本客服机器人、语音客服机器人，AI虚拟数字人系统可以提供更加真实的人性化交互，不仅可以通过文字和语音与用户进行互动，还能够通过视频呈现更加真实的沟通场景。通过视

来自：帮助中心

查看更多 →
配置机器人

本的流程，如果客户的主叫号码在某一个版本灰度规则的号码区间内，则优先选择该版本流程，否则选默认流程对应的版本流程。直接转人工对话次数：用于统计报表，区分直接转人工和咨询后转人工的对话次数上限值，默认值为3。抓包会话服务：是否开启宇高抓包会话服务。启用：开启后呼叫呼入时会自动

来自：帮助中心

查看更多 →
文字识别

立即使用成长地图由浅入深，带您玩转OCR 01 了解了解华为云文字识别服务的产品介绍、应用场景、使用限制，有助于更好的使用文字识别服务。产品介绍什么是文字识别应用场景展示使用限制说明智能分类介绍 03 入门文字识别服务以开放API（Application Programming

来自：帮助中心

查看更多 →
语音通话 VoiceCall

token有效期内多次调用fastlogin接口，只有其中一个token生效，如何处理？ token有效期内多次调用fastlogin接口，只有其中一个token生效，如何处理？ token失效原因： token冲突，使用的token不是最新的。 access_token生成后有

来自：帮助中心

查看更多 →