智能交互设置
直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。
操作步骤
- 登录MetaStudio控制台,进入MetaStudio服务概览页面。
- 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。
- 单击“分身视频直播”卡片,进入分身数字人直播首页面。
- 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。
- 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。
参数配置说明,如表1所示。
表1 参数说明 参数
说明
应用
请先参考后续步骤6,创建完成应用后,再从下拉框中选择此应用。
弹幕触发间隔时间
取值范围[-1,120],单位:秒。
取值含义如下所示:
- -1:只触发1次。
- 0:一直触发。
- 其他数值:同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。
默认值:120。
用户入场触发间隔时间
取值范围[-1,120],单位:秒。
取值含义如下所示:
- -1:只触发1次。
- 0:一直触发。
- 其他数值:同一条达到互动条件的用户入场规则重复触发的间隔时间,每条规则的触发时间互不影响。
默认值:120。
点赞触发间隔时间
取值范围[-1,120],单位:秒。
取值含义如下所示:
- -1:只触发1次。
- 0:一直触发。
- 其他数值:同一条点赞规则重复触发的间隔时间,每条规则的触发时间互不影响。
默认值:120。
送礼触发间隔时间
取值范围[-1,120],单位:秒。
取值含义如下所示:
- -1:只触发1次。
- 0:一直触发。
- 其他数值:同一条送礼规则重复触发的间隔时间,每条规则的触发时间互不影响。
默认值:120。
- 单击“去设置”,弹出“智能交互”对话框,如图2所示。
需要创建智能交互应用,详细的参数配置说明如表2所示。
表2 互动问答配置 参数
说明
第三方应用
选择“第三方大脑(大模型)”。
应用名称
输入自定义的应用名称。
APPID
MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。
APPKEY
MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。
第三方语言模型地址
MetaStudio服务调用第三方语言模型的API地址。
MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。
流式响应
MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。是否开启流式问答能力,取决于第三方大模型是否支持。
多轮语境理解能力
配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
配置说明,如下所示:
- 如果设置为“1”,则问答请求时,不支持携带历史对话。
- 如果设置为非“1”,则问答请求时,携带历史对话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2轮问答。其他数值的配置效果,以此类推。
ASR服务
从下拉框中选择“华为云SIS”。
对话内容合规审核
开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。
配置检查
单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。
尾静音时长
云端会对音频进行VAD检测,如果一句话末尾的静音时长超过配置的尾静音时长,就会结束语音识别。建议该值大于500ms。
委托语言交互服务(SIS)
SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权,详细操作如下所示。
- 单击“委托语言交互服务(SIS)”右侧开关,界面弹出“选择委托站点”对话框。
- 从下拉框中选择购买SIS服务的站点,单击“确定”,弹出“SIS服务权限”对话框。
- 需要先开通实时语音识别服务的“* (Everyone)”账号权限,详细操作如下所示,也可以参考开通语音交互服务进行操作。
如果不执行本操作,则进行智能交互对话时,界面会提示“语音识别服务SIS未开通,请前往控制台开通”,即不开通无法实现智能交互功能。
- 单击“前往开通”,浏览器新增一个页签,进入语音交互服务总览页面。
- 在“服务介绍”区域的“实时语音识别”页签,单击“开通管理”,弹出“开通管理 - 实时语音识别”对话框。
- 单击“* (Everyone)”用户名右侧的“开通服务”,开通“* (Everyone)”账号。
- 再开通SIS服务权限,仅需在“SIS服务权限”对话框,单击“同意授权”即可。
如果授权过程中出现报错信息“没有委托操作权限”,可能是当前IAM用户没有权限授权,需要参考开通委托报错如何处理?处理。
开启委托授权后,新增展示如下配置:
- 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置。
- SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。
- 单击“确定”,智能交互应用创建完成。