更新时间:2024-04-26 GMT+08:00
分享

方案概述

应用场景

该解决方案是华为云语音交互服务SIS基于FunctionGraph开发的一套隐私通话内容分析工作流。帮助您迈出传统行业向数字化转型的第一步,使用智能语音交互提高人工隐私通话内容分析覆盖率和效率。适用于以下需求场景:

  1. 货运出行行业隐私通话分析;
  2. 金融保险领域业务洞察分析;
  3. 安防风控领域反诈威胁分析。

方案架构

该解决方案支持一键式部署隐私通话内容分析函数工作流服务、创建OBS输入输出桶,帮助客户快速构建一个隐私通话内容分析工作流,具备开箱即用、方便易用的特点。解决方案架构如下:
图1 方案架构

该解决方案会部署如下资源:

  • 语音交互服务SIS: 提供隐私通话录音文件转写的能力。
  • 对象存储服务OBS:用于存放用户上传的隐私通话录音文件和工作流处理的语音识别结果和分析结果。
  • 函数工作流FunctionGraph:用于配置工作流的触发器和部署内容分析算子。

方案优势

  • 高准确率

    客服中心语音质检采用了华为云语音交互服务SIS的ASR能力,将隐私通话录音可以转写成识别文本,在通用测试数据集上上正确率可达90%以上。

  • 开箱即用

    通过配置算子触发规则和内容分析规则,用户只需要上传obs动作即可完成隐私通话内容分析。

  • 开源和定制化

    该解决方案是开源的,用户可以免费用于商业用途,并且还可以在源码基础上进行定制化开发。

约束与限制

  • 部署该解决方案前,您需注册华为账号并开通华为云,完成实名认证,且账号不能处于欠费或冻结状态,请根据资源和成本规划中预估价格。
  • 该方案只支持用户上传采样率为8000的双声道中文录音音频,其中音频支持pcm16k16bit、pcm8k16bit、ulaw16k8bit、ulaw8k8bit、alaw16k8bit、alaw8k8bit、vox8k4bit、v3_8k4bit、WAV(支持pcm/ulaw/alaw/adpcm编码格式)、MP3、M4A、ogg-speex、ogg-opus、AMR。
  • 因函数工作流超时时间限制,上传的录音时长不应超过20min。
  • 本解决方案提供的测试样例由华为云语音交互服务语音合成服务生成,仅用于demo演示。
  • 卸载解决方案前,请先确保OBS桶中无数据,否则解决方案将卸载失败。
分享:

    相关文档

    相关产品