更新时间:2024-05-11 GMT+08:00
分享

数字人回复图元

智能视频客服回应客户的数字人。当需要在流程中向客户播放数字人视频时,可使用该图元。

图元展示

参数介绍

  • 节点名称:标识节点名称。
  • 描述:节点的详细说明信息。
  • 操作:“启动”“回复文本”“结束”
    图1 数字人图元操作设置
    • 启动:与数字人服务开启会话,同时指定需要使用的数字人形象。
    • 回复文本:将配置的文本提供给数字人服务进行视频后播放,回复文本中可以添加参数变量,数字人服务会根据变量返回的值动态生成视频。
    • 结束:与数字人服务结束会话。
  • 数字人形象:当“操作”“启动”时显示,选择您在配置中心>流程配置>资源管理>2D数字人 中配置的资源。
    图2 数字人形象设置
  • 回复变量:当“操作”“回复文本”时显示,输入数字人用于回复的文本变量。
    图3 回复文本设置

  • 回复模式:为必选,取值范围如下:
    • 只播放:表示只播放语音/视频,不需要接收客户的内容。通常静态放音时选择。
    • 支持识别打断播放表示需要客户语音应答,通常回复文本时选择。
    • 支持按键打断播放:表示需要获取客户输入的按键信息。机器人回复图元的回复模式为按键打断时,如需要获取按键交互的结果,则该机器人回复图元不能直接连接结束图元,并且结束图元前也不能直接连接按键识别和语义识别图元。
    • 支持识别和按键打断播放既可接收语音信息,也可接收按键信息,哪个信息先接收到按哪个信息去匹配。
    • 支持播放后再识别语音/视频播放完成后才开始识别,如果在播放过程中说话,则接收不到语音信息。
    • 支持播放后再识别和按键:语音/视频播放完成后才开始识别或收号,如果在播放过程中说话/按键,则接收不到信息,播放后说话/按键,哪个信息先接收到按哪个信息去匹配。
    • 支持按键后不打断播放语音/视频播放开始就可以进行按键操作,但是不会打断放音。
    • 自定义变量值:标识是否可被打断,如果可打断则在最少放音时间输入框填入最少放音时间。

      字符串true -- 可以被识别打断,可以传递最少放音时间。

      字符串false -- 播放后识别 。

  • 超时时间:单位秒,未配置使用默认15秒。当超过该时长设置时,系统判定超时。不同厂商这个参数的取值范围不同, 当前最长是180秒。
    • 支持播放后再识别,这个时间将从播放结束后开始计算,指的是播放完TTS到停止识别的时间。
    • 支持按键/识别打断,这个时间将从放音结束计算,例如TTS结束放音后,用户如果一直不说话,聊天机器人到超时时间后会进入下一个图元。
    • 只播放:超时时间不会生效。

    在长文本放音、用户输入较多的按键如身份证或判断用户需要说较多意见等场景时,请注意超时时间的设置。支持按键/识别打断的回复模式下,超时时间设置过短会造成放音没结束就开始识别或者用户还没输完按键就识别结束。超时时间设置过长会导致用户无输入下始终静默,过很久才会有超时提醒。

  • ASR高级配置:“开启”“关闭”。默认关闭。
    • 识别类型:“普通识别”。默认普通识别,ASR高级配置开启时可配。
    • 用户无话超时时长:默认100,单位秒,取值范围:0~32000,ASR高级配置开启时可配。
    • 识别结果超时时长:默认200,单位秒,取值范围:0~600,ASR高级配置开启时可配。
    • 用户停顿超时时长:默认500,单位毫秒,取值范围:300~2000,ASR高级配置开启时可配。
    • ASR扩展参数:请输入IVR侧需要的ASR业务需要的数据,例如提供商信息,该值会通过对话接口的vendor参数回传给IVR。
  • TTS高级配置:“开启”“关闭”。默认关闭。
    图4 TTS高级配置
    • 发音人:手动输入,配置数字人需要使用的发音人,TTS高级配置开启时可配。
    • 音速:手动输入,取值范围[0.5-1.5],手工输入,只支持一位小数(1.0为正常语速,值为0.5时播报语速最慢,值为1.5时播报语速最快),TTS高级配置开启时可配。
  • 合成视频配置:“开启”“关闭”。默认关闭。
    图5 合成视频配置
  • 动作:手动输入,配置数字人需要使用的动作,合成视频配置开启时可配置。
  • 图片视频设置:包括了前景图、后景图、前景视频、后景视频设置。
    图6 图片视频设置
    • 前景图:用于合成数字人视频时,配置需要在数字人前方展示的图片。一个图元最多配置5条前景图。
      • 图片:选择您在配置中心>资源管理>音视频资源管理 中配置的2D数字人图片资源。
      • 横坐标:手动输入需要展示位置的横坐标,请输入大于0的整数,默认值0。
      • 纵坐标:手动输入需要展示位置的纵坐标,请输入大于0的整数,默认值0。
      • 缩放比例:手动输入需要展示图片的缩放比例,支持一位小数,取值范围 0.5-1.0。
      • 开始时间:手动输入图片开始展示的时间,请输入大于0的整数,单位毫秒。允许为空。
      • 播放时长:手动输入图片需要展示的时长,请输入大于0的整数,单位毫秒。允许为空。
    • 后景图:用于合成数字人视频时,配置需要在数字人后方展示的图片。一个图元最多配置5条后景图。
      • 图片:选择您在配置中心>资源管理>音视频资源管理 中配置的2D数字人图片资源。
      • 横坐标:手动输入需要展示位置的横坐标,请输入大于0的整数,默认值0。
      • 纵坐标:手动输入需要展示位置的纵坐标,请输入大于0的整数,默认值0。
      • 缩放比例:手动输入需要展示图片的缩放比例,支持一位小数,取值范围 0.5-1.0。
      • 开始时间:手动输入图片开始展示的时间,请输入大于0的整数,单位毫秒。允许为空。
      • 播放时长:手动输入图片需要展示的时长,请输入大于0的整数,单位毫秒。允许为空。
    • 前景视频:用于合成数字人视频时,配置需要在数字人前方展示的视频。一个图元只能配置1条前景视频。
      • 视频:选择您在配置中心>资源管理>音视频资源管理 中配置的2D数字人视频资源。
      • 横坐标:手动输入需要展示位置的横坐标,请输入大于0的整数,默认值0。
      • 纵坐标:手动输入需要展示位置的纵坐标,请输入大于0的整数,默认值0。
      • 缩放比例:手动输入需要展示视频的缩放比例,支持一位小数,取值范围 0.5-1.0。
      • 显示开始时间:手动输入视频开始展示的时间,请输入大于0的整数,单位毫秒。允许为空。
    • 后景视频:用于合成数字人视频时,配置需要在数字人后方展示的视频。一个图元只能配置1条后景视频。
      • 视频:选择您在配置中心>资源管理>音视频资源管理 中配置的2D数字人视频资源。
      • 横坐标:手动输入需要展示位置的横坐标,请输入大于0的整数,默认值0。
      • 纵坐标:手动输入需要展示位置的纵坐标,请输入大于0的整数,默认值0。
      • 缩放比例:手动输入需要展示视频的缩放比例,支持一位小数,取值范围 0.5-1.0。
      • 显示开始时间:手动输入视频开始展示的时间,请输入大于0的整数,单位毫秒。允许为空。

分支条件介绍

表1 分支条件

名称

含义

使用方法

SYSERROR_INNER

odfs内部错误

ODFS内部发生其他未知错误时会触发该分支条件。

如何使用图元

  • 单击图元,或使用鼠标将图元拖拽到画布上。在配置数字人回复参数前,您需要事先维护数字人形象,然后在服务参数区域选择您预先维护的数字人形象。

典型使用场景

下面使用数字人回复图元示例一个向客户播放欢迎词的场景。

  1. 操作员登录客户服务云,选择配置中心>机器人管理>流程配置
  2. 配置智能IVR流程。

    1. 选择流程管理 > 流程编排,单击增加一个简单流程。
    2. 单击流程变量区域后的+,在弹出窗口中填写变量名称和数据类型,该变量的缺省值用于向客户播放。
      图7 添加流程变量界面
      图8 流程编排示例

    3. 保存并发布流程。

  3. 选择智能机器人,将流程绑定机器人。
  4. 选择智能机器人,在对应机器人的最后一列单击“呼叫测试”,在弹出的测试对话窗口中单击“开始呼叫”,测试机器人。机器人自动回答有数字人服务生成的视频路径表示配置成功。

分享:

    相关文档

    相关产品