sis
实时语音转写连续模式
更新时间:2020/07/31 GMT+08:00
功能介绍
连续识别模式的语音总长度限制为五小时,适合于会议、演讲和直播等场景。
连续识别模式在流式识别的基础上,结合了语音的端点检测功能。语音数据也是分段输入,但是连续识别模式将会在处理数据之前进行端点检测,如果是语音才会进行实际的解码工作,如果检测到静音,将直接丢弃。如果检测到一段语音的结束点,就会直接将当前这一段的识别结果返回,然后继续检测后面的语音数据。因此在连续识别模式中,可能多次返回识别结果。如果送入的一段语音较长,甚至有可能在一次返回中包括了多段的识别结果。
由于引入了静音检测,连续识别模式通常会比流式识别能具有更高的效率,因为对于静音段将不会进行特征提取和解码操作,因而能更有效地利用CPU。而流式识别通常和客户端的端点检测功能相结合,只将检测到的有效语音段上传到服务器进行识别。
wss-URI
- 参数说明
表1 参数说明 参数名
是否必选
说明
project_id
是
项目编号。获取方法,请参见获取项目ID。
- 请求示例
wss://{endpoint}/v1/{project_id}/rasr/continue-stream Request Header: X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...
父主题: Websocket握手请求
