更新时间:2025-08-18 GMT+08:00
分享

智能交互设置

直播间页面支持弹幕规则使用“智能交互”的方式,去回复直播间用户的提问。智能交互的方式相当于提供了一个第三方语言模型去答复用户问题。

操作步骤

  1. 登录MetaStudio控制台,进入MetaStudio服务概览页面。
  2. 单击“前往MetaStudio工作台”,进入MetaStudio工作台页面。
  3. 单击“分身视频直播”卡片,进入分身数字人直播首页面。
  4. 在“直播管理”页签,单击“创建直播间”,进入视频直播制作界面。
  5. 选择“互动设置”,单击右侧的“设置”,弹出“智能交互”对话框,如图1所示。

    参数配置说明,如表1所示。
    图1 智能交互设置
    表1 参数说明

    参数

    说明

    应用

    请先参考后续步骤6,创建完成应用后,再从下拉框中选择此应用。

    弹幕触发间隔时间

    取值范围[-1,120],单位:秒。

    取值含义如下所示:

    • -1:只触发1次。
    • 0:一直触发。
    • 其他数值:同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。

    默认值:120。

    用户入场触发间隔时间

    取值范围[-1,120],单位:秒。

    取值含义如下所示:

    • -1:只触发1次。
    • 0:一直触发。
    • 其他数值:同一条达到互动条件的用户入场规则重复触发的间隔时间,每条规则的触发时间互不影响。

    默认值:120。

    点赞触发间隔时间

    取值范围[-1,120],单位:秒。

    取值含义如下所示:

    • -1:只触发1次。
    • 0:一直触发。
    • 其他数值:同一条点赞规则重复触发的间隔时间,每条规则的触发时间互不影响。

    默认值:120。

    送礼触发间隔时间

    取值范围[-1,120],单位:秒。

    取值含义如下所示:

    • -1:只触发1次。
    • 0:一直触发。
    • 其他数值:同一条送礼规则重复触发的间隔时间,每条规则的触发时间互不影响。

    默认值:120。

  6. 单击“去设置”,弹出“智能交互”对话框,如图2所示。

    需要创建智能交互应用,详细的参数配置说明如表2所示。
    图2 智能交互
    表2 互动问答配置

    参数

    说明

    第三方应用

    选择“第三方大脑(大模型)”。

    应用名称

    输入自定义的应用名称。

    APPID

    MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPID信息。

    APPKEY

    MetaStudio对接第三方语言模型LLM时,需要LLM提供的APPKEY信息。

    第三方语言模型地址

    MetaStudio服务调用第三方语言模型的API地址。

    MetaStudio服务对接第三方语言模型LLM时,需要按照MetaStudio服务定义的接口参数格式开发LLM接口,详见智能交互第三方LLM回调接口。然后由MetaStudio服务调用此接口,实现智能交互能力。

    流式响应

    MetaStudio智能交互提供流式问答和非流式问答能力,其中流式问答响应更快。开启后使用流式问答能力, 关闭则使用非流式问答能力。是否开启流式问答能力,取决于第三方大模型是否支持。

    多轮语境理解能力

    配置数值越高,问答请求携带的历史对话个数越多,语境理解能力更强。

    配置说明,如下所示:

    • 如果设置为“1”,则问答请求时,不支持携带历史对话。
    • 如果设置为非“1”,则问答请求时,携带历史对话。示例:取值为“3”时,问答请求中会携带1个最新问题,和历史最新的2轮问答。其他数值的配置效果,以此类推。

    ASR服务

    从下拉框中选择“华为云SIS”。

    对话内容合规审核

    开启后,将自动审核用户的提问内容,若问题存在违禁词,系统将自动拦截返回默认答案。如果关闭,将无法审核用户提问是否合规。

    配置检查

    单击“配置检查”,自动检查当前页签配置是否正确,如果有问题,会给出相应提示。

    尾静音时长

    云端会对音频进行VAD检测,如果一句话末尾的静音时长超过配置的尾静音时长,就会结束语音识别。建议该值大于500ms。

    委托语言交互服务(SIS)

    SIS服务用于将用户口述音频转换为文本。如需使用热词功能,请开启委托授权,详细操作如下所示。

    1. 单击“委托语言交互服务(SIS)”右侧开关,界面弹出“选择委托站点”对话框。
    2. 从下拉框中选择购买SIS服务的站点,单击“确定”,弹出“SIS服务权限”对话框。
    3. 需要先开通实时语音识别服务的“* (Everyone)”账号权限,详细操作如下所示,也可以参考开通语音交互服务进行操作。
      如果不执行本操作,则进行智能交互对话时,界面会提示“语音识别服务SIS未开通,请前往控制台开通”,即不开通无法实现智能交互功能。
      1. 单击“前往开通”,浏览器新增一个页签,进入语音交互服务总览页面。
      2. 在“服务介绍”区域的“实时语音识别”页签,单击“开通管理”,弹出“开通管理 - 实时语音识别”对话框。
      3. 单击“* (Everyone)”用户名右侧的“开通服务”,开通“* (Everyone)”账号。
    4. 再开通SIS服务权限,仅需在“SIS服务权限”对话框,单击“同意授权”即可。

    如果授权过程中出现报错信息“没有委托操作权限”,可能是当前IAM用户没有权限授权,需要参考开通委托报错如何处理?处理。

    开启委托授权后,新增展示如下配置:

    • 热词:数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。这里仅开启热词功能,实际的热词配置,请参见对话配置
    • SIS委托站点:从下拉框中选择用户授权SIS服务所在Region。

  7. 单击“确定”,智能交互应用创建完成。

相关文档