更新时间:2026-06-26 GMT+08:00
方案概述
应用场景
Xinference 是一款基于大语言模型的开源框架。本方案在此基础上进行功能扩展,对接华为云 SIS 语音服务,实现语音转文本(ASR)和文本转语音(TTS)能力。语音识别脚本调用华为云 SIS 接口,将用户语音实时转写为文本,作为 Xinference 大模型的输入;语音合成脚本则将模型生成的回复文本合成为语音输出。核心是打造一个"能听会说"的智能对话系统,让用户无需键盘输入,直接用语音即可完成交互,获得流畅自然的语音回复体验。
方案架构
该解决方案以Xinference作为框架,SIS语音服务作为底层语音调用,帮助您快速部署语音交互服务服务。您可以根据实际情况,选择部署语音转文本(SenseVoiceSmall)和文本转语音服务(CosyVoice-300M)。
图1 方案架构图

该解决方案将会部署如下资源:
- 创建1台华为云Flexus云服务器X实例,用于部署Xinference模型应用。
- 创建1个弹性公网IP EIP并关联Flexus X实例,提供访问公网和被公网访问能力。
- 创建1个语音交互服务 SIS,提供语音交互服务能力。
方案优势
约束与限制
- 该解决方案部署前,需注册华为账号并开通华为云,完成实名认证,且账号不能处于欠费或冻结状态。如果计费模式选择“包年包月”,请确保账户余额充足以便一键部署资源的时候可以自动支付;或者在一键部署的过程进入费用中心,找到“待支付订单”并手动完成支付。
- 如果选用IAM委托权限部署资源,请确保使用的华为云账号有IAM的足够权限,具体请参考创建rf_admin_trust委托;如果使用华为主账号或admin用户组下的IAM子账户可不选委托,将采用当前登录用户的权限进行部署。