语音交互服务 SIS
语音交互服务 SIS
- 最新动态
- 服务公告
- 产品介绍
- 快速入门
- 用户指南
- SDK参考
- API参考
-
常见问题
- 产品咨询类
- 计费类
-
API使用类
- 如何查看接口调用量
- 为什么WebSocket一直连接不成功
- 为什么会出现识别结果非常差的情况
- 如何使用Websocket调用实时语音识别
- 有哪些途径可以使用语音交互的API
- 返回状态正常,但识别结果为空
- Token消息体中user name,domain name和project name分别指的是什么
- 如何调整并发
- 为什么录音文件识别出现重复转写结果
- 调用语音交互的API显示auth failed
- 调用语音交互的API超时怎么处理(connect timeout)
- 为什么服务端返回OBS链接不可用(data url is unreachable)
- 语音合成的base64编码如何使用
- 录音文件识别多久可以返回结果
- 语音合成能不能支持返回立体音(双声道)格式的音频
- 如何解决“The silence time is too long, and the audio will not be recognized”报错
- Token怎么获取
- 如何申请公测
- 如何修改发音人
- 实时语音识别多人同时使用,如何区分各自识别结果
- 使用HTML5 Websocket API发送websocket请求如何携带token
- 如何查看实时语音识别的中间结果
- SDK使用类
- 错误码类
- 部署类
- 区域与可用区
- 权限类
- 服务声明类
- 文档下载
- 通用参考
链接复制成功!
时间戳数据
功能介绍
实时语音合成服务在生成音频流的同时,可以生成每个汉字/英文单词的时间戳信息。该信息可用于视频字幕和驱动数字人口型。
参数设置
设置请求参数subtitle为"word_level"或"phoneme_level"时,开启时间戳功能。
响应信息
名称 |
参数类型 |
说明 |
---|---|---|
resp_type |
String |
响应类型。参数值为RESULT。 |
trace_id |
String |
服务内部的令牌,可用于在日志中追溯具体流程。 |
result |
List |
时间戳信息 |
名称 |
参数类型 |
说明 |
---|---|---|
start_time |
Integer |
文本对应的合成音频的开始时间戳,单位是ms。 |
end_time |
Integer |
文本对应的合成音频的结束时间戳,单位是ms。 |
text |
String |
文本信息。 |
word_index |
Integer |
文本在整句中的位置,从0开始计数。 |
phonemes |
List |
音素时间戳信息,当subtitle取值为phoneme_level时,返回该信息。 |
名称 |
参数类型 |
说明 |
---|---|---|
phoneme |
String |
音素文本信息。 |
start_time |
Integer |
音素对应的合成音频的开始时间戳,单位是ms。 |
end_time |
Integer |
音素对应的合成音频的结束时间戳,单位是ms。 |
phoneme_index |
Integer |
音素位置信息,从0开始。 |
示例
word_level
{ 'resp_type': 'RESULT', 'trace_id': 'd34e3ccb-0383-4c76-a107-ec6ced44614f', 'result': [ {'start_time': 43980, 'end_time': 44210, 'word_index': 10, 'text': '从'}, {'start_time': 44210, 'end_time': 45298, 'word_index': 11, 'text': '而'} ] }
phoneme_level
{ 'resp_type': 'START', 'trace_id': '22706fed-ab0e-4167-a6c7-e4dbc59898b1', 'result': [ { 'word_index': 217, 'text': '需', 'start_time': 458 'end_time': 650 "phonemes": [ {'phoneme_index': 0, 'start_time': 458, 'end_time': 602, 'phoneme': 'x'}, {'phoneme_index': 1, 'start_time': 602, 'end_time': 650, 'phoneme': 'v1'} ] }, { 'word_index': 217, 'text': '要', 'start_time': 650 'end_time': 922 "phonemes": [ {'phoneme_index': 0, 'start_time': 650, 'end_time': 922, 'phoneme': 'iao4'} ] } ] }
父主题: 语音合成结果响应