更新时间:2024-09-14 GMT+08:00
分享

智能交互素材操作详情

智能交互界面支持添加角色背景对话等素材。本节提供各类素材的详细操作过程。

角色

角色界面详情,如图1所示。

图1 角色界面

角色界面说明,如表1所示。

表1 界面元素说明

界面元素

说明

定制数字人

单击“定制数字人”,跳转至形象制作页面,界面详情和操作指导,详见创建分身数字人定制任务

关键词搜索框,可输入数字人名称进行精准搜索。

示例:云岚。

刷新图标。如果有关键词,按照关键词进行刷新展示;如果没有关键词,恢复为默认展示。

筛选条件

支持通过角色、性别、姿势、行业、区域和分辨率的维度,筛选展示下方的数字人。

数字人列表

默认展示全量数字人。单击数字人形象,自动替换至智能交互预览界面中。

背景

背景界面详情,如图2所示。

图2 背景界面

背景界面说明,如表2所示。

表2 界面元素说明

界面元素

说明

本地导入

单击“本地导入”,从本地选择PNG、JPG、JPEG和BMP格式的图片上传。

也支持直接拖拽本地图片至图片列表区域,完成上传操作。

关键词搜索框,可输入图片名称进行精准搜索。

示例:科技。

筛选条件

支持通过背景图片来源的维度,筛选展示下方的图片。

图片列表

默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。

第一张图为透明背景,单击透明背景后,仅智能交互预览页面会替换为透明背景。如果需要透明背景正式生效,还需要设置智能交互SDK的如下参数,任选其一设置即可。

  • 设置create接口参数config内的配置参数useDefaultBackground,其默认值为true,需修改为false。

    代码示例,如下所示:

    HwICSUiSdk.create({
      serverAddress: 'serverAddress',
      onceCode: 'onceCode',
      robotId: 'robotId',
      containerId: 'ics-root',
      config: {
        useDefaultBackground: false
      },
    });
  • 设置setConfig接口参数useDefaultBackground,其默认值为true,需修改为false。

    代码示例,如下所示:

    HwICSUiSdk.setConfig({
      useDefaultBackground: false
    });

进行智能交互时,透明背景支持的浏览器及其版本,详见客户端SDK参考-快速入门-表3

对话

配置对话,可以设置数字人欢迎语和热点问题,方便用户与数字人进行交互问答。执行对话配置前,需要完成应用创建操作。

配置对话的详细操作,如下所示:

  1. 登录MetaStudio控制台,单击“智能交互”,如图3所示。

    图3 MetaStudio控制台页面

  2. 在左侧导航栏中,选择“对话”,如图4所示。

    参数配置说明如表3所示。

    图4 创建对话
    表3 创建对话

    参数

    说明

    欢迎语

    • 设置欢迎语后,用户单击如图5所示①区域的“点击开始对话”图标时,数字人会主动与用户打招呼,说出欢迎语的内容。

      示例:你好,我是小助手,很高兴认识你。

    • 也支持在“欢迎语”这里设置走动数字人,即数字人走动入场,并向用户打招呼。输入内容需严格遵循下述格式,且数字人形象采集时,需拍摄入场动作。
      <speak><insert-action name="入场" tag="WALKING"/>文字</speak>

      “文字”示例:嗨,我在,请问你有什么问题?

    热点问题

    如果用户不知如何提问,可参考热点问题进行提问。

    热点问题会展示在如图5所示②区域的位置。

    语言

    数字人对话界面的语言。

    包含如下选项:

    • 中文
    • 英文

    注意:科大讯飞场景下,如果选择“英文”,科大讯飞应用必须要新增English情景模式,操作请参考:

    尾静音时长

    系统会对用户的提问音频进行检测,如果一句话末尾的静音时长超过500ms,会结束语音识别。

    建议取值大于500ms。

    热词

    数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。

    单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。

    如果开启热词配置,需要同时配置下述参数:

    • SIS服务授权:SIS服务用于将用户口述音频转换为文本,需要开启授权。

      详细操作如下所示:

      1. 开启“SIS服务授权”,弹出“SIS服务授权”对话框。
      2. 单击“同意授权”,MetaStudio服务会自动在“统一身份认证服务 IAM > 委托”为您创建委托“metaStudio_admin_trust”。
    • 委托站点:从下拉框中选择用户授权SIS服务所在Region。
    • 热词ID:需要确保热词ID所在Region、语言类型与智能交互配置的SIS委托站点、语言类型一致,否则热词配置不生效。

      需参考创建热词表,创建一个热词表,再参考调用热词表,复制热词ID至当前“热词ID”配置中。

    声音

    这里选择的声音,需要与前面选择的语言匹配。如果是中文,则选择中文声音,否则数字人表达会有问题。

    还可以根据实际情况,设置语速、音量和音高。

    • 语速:设置语速,取值范围[0.5X,2X]。设置为0.5X时,声音放慢至0.5倍速播放;设置为2X时,声音加速至2倍速播放。
    • 音量:设置声音大小,取值范围[90,240]。为保证播放音量适中,建议用户调大初始音量。
    • 音高:设置声音高低,取值范围[50,200]。音高会调整音色的高频部分,增高声音会更尖锐,降低声音会更低沉。
    图5 数字人交互预览页面

  3. 智能交互配置完成后,单击界面右上角的“保存”,保存所有对话配置。

相关文档