智能交互
MetaStudio平台智能交互能力支持创建数字人智能交互对话项目,实现用户和数字人对话。下面以“第三方大脑(大模型)”为例,进行操作演示。如需了解智能交互全量功能,请参考智能交互。
创建数字人智能交互对话项目
- 登录MetaStudio控制台,进入MetaStudio服务概览页面。
- 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。
- 单击“分身智能交互”,在智能交互对话项目编辑页面,依次设置角色和背景。
- 查看界面右侧的“互动问答”页签,如图2所示。
参数配置说明,如表1所示。
表1 互动问答配置 参数
说明
第三方应用
选择“第三方大脑(大模型)”。
应用名称
输入自定义的应用名称。
APPID
MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。
APPKEY
MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。
第三方语言模型地址
MetaStudio服务调用第三方语言模型的API地址。
MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。
流式响应
MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。是否开启流式问答能力,取决于第三方大模型是否支持。
多轮语境理解能力
配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。
配置说明,如下所示:
- 如果设置为“1”,则问答请求时,不支持携带历史对话。
- 如果设置为非“1”,则问答请求时,携带历史对话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2轮问答。其他数值的配置效果,以此类推。
ASR服务
从下拉框中选择“奇妙问”。
ASR账号
输入访问奇妙问平台的账号,详见奇妙问配置。
ASR密钥
输入访问奇妙问平台的密钥,详见奇妙问配置。
配置检查
单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。
尾静音时长
云端会对音频进行VAD检测,如果一句话末尾的静音时长超过配置的尾静音时长,就会结束语音识别。建议该值大于500ms。
- 单击“确定”,应用创建完成,效果如图3所示。
- (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。
- 单击“发布设置”页签,参考表2配置参数。
- 单击界面右上角的“发布”,发布数字人智能交互对话。
发布成功后,弹出如图4所示的对话框,可以单击发布链接,在“智能交互激活”界面复制输入激活码,激活数字人交互项目,与数字人进行对话。