智能交互
MetaStudio平台智能交互能力支持创建数字人智能交互对话项目,实现用户和数字人对话。下面以“第三方大脑(大模型)”为例,进行操作演示。如需了解智能交互全量功能,请参考智能交互。
创建数字人智能交互对话项目
- 登录MetaStudio控制台,进入MetaStudio服务概览页面。
- 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。
- 单击“分身智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。
- 查看界面右侧的“互动问答”页签,如图1所示。
参数配置说明,如表1所示。
表1 互动问答配置 参数
说明
第三方应用
选择“第三方大脑(大模型)”。
应用名称
输入自定义的应用名称。
APPID
MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。
APPKEY
MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。
第三方语言模型地址
MetaStudio服务调用第三方语言模型的API地址。
MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。
流式响应
MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。是否开启流式问答能力,取决于第三方大模型是否支持。
多轮语境理解能力
配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
配置说明,如下所示:
- 如果设置为“1”,则问答请求时,不支持携带历史对话。
- 如果设置为非“1”,则问答请求时,携带历史对话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2轮问答。其他数值的配置效果,以此类推。
ASR服务
从下拉框中选择“华为云SIS”。
对话内容合规审核
开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。
配置检查
单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。
尾静音时长
云端会对音频进行VAD检测,如果一句话末尾的静音时长超过配置的尾静音时长,就会结束语音识别。建议该值大于500ms。
委托语言交互服务(SIS)
SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权,详细操作如下所示。
- 单击“委托语言交互服务(SIS)”右侧开关,界面弹出“选择委托站点”对话框。
- 从下拉框中选择购买SIS服务的站点,单击“确定”,弹出“SIS服务权限”对话框。
- 需要先开通实时语音识别服务的“* (Everyone)”账号权限,详细操作如下所示,也可以参考开通语音交互服务进行操作。
如果不执行本操作,则进行智能交互对话时,界面会提示“语音识别服务SIS未开通,请前往控制台开通”,即不开通无法实现智能交互功能。
- 单击“前往开通”,浏览器新增一个页签,进入语音交互服务总览页面。
- 在“服务介绍”区域的“实时语音识别”页签,单击“开通管理”,弹出“开通管理 - 实时语音识别”对话框。
- 单击“* (Everyone)”用户名右侧的“开通服务”,开通“* (Everyone)”账号。
- 再开通SIS服务权限,仅需在“SIS服务权限”对话框,单击“同意授权”即可。
如果授权过程中出现报错信息“没有委托操作权限”,可能是当前IAM用户没有权限授权,需要参考开通委托报错如何处理?处理。
开启委托授权后,新增展示如下配置:
- 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。
- SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。
- 单击“确定”,应用创建完成,效果如图2所示。
- (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。
- 单击“发布设置”页签,参考表2配置参数。
- 单击界面右上角的“发布”,发布数字人智能交互对话。
发布成功后,弹出如图3所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。