一句话识别

短语音识别将口述音频转换为文本,通过API调用识别不超过一分钟的不同音频源发来的音频流或音频文件。适用于语音搜索、人机交互等语音交互识别场景。

 

    语音识别字幕 更多内容
  • 媒资发布

    表8 SubtitleInfo 参数 参数类型 描述 url String 字幕文件的下载地址 id Integer 字幕文件id type String 字幕文件类型 language String 字幕文件语言种类 表9 File_addr 参数 参数类型 描述 bucket String

    来自:帮助中心

    查看更多 →

  • 语音合成

    当前服务仅支持北京和上海区域,后续会陆续上线其他区域。 华北-北京四,推荐的区域,支持 一句话识别 、录音文件识别、实时 语音识别 语音合成 和热词等接口。 华东-上海一,推荐的区域,支持一句话识别、录音文件识别、实时语音识别、语音合成和热词等接口。 支持中文、英文、中英文,文本不长于500个字符。 支持合成采样率8kHz、16kHz。

    来自:帮助中心

    查看更多 →

  • 错误码

    M3U8 file do not contain the specified default language. 字幕文件列表和M3U8文件中均不存在指定默认语言 字幕文件列表和M3U8文件中均不存在指定默认语言 400 MPC.10156 File deletion failed

    来自:帮助中心

    查看更多 →

  • 错误码

    M3U8 file do not contain the specified default language. 字幕文件列表和M3U8文件中均不存在指定默认语言 字幕文件列表和M3U8文件中均不存在指定默认语言 400 MPC.10156 File deletion failed

    来自:帮助中心

    查看更多 →

  • iOS SDK

    iOS SDK 一句话识别 实时语音识别连续模式

    来自:帮助中心

    查看更多 →

  • 约束与限制

    约束与限制 实时语音识别 一句话识别 录音文件识别 语音合成 录音文件识别极速版

    来自:帮助中心

    查看更多 →

  • 更新智能直播间信息

    取值范围:[4, 120] h 否 Integer 字幕框高度 说明: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数 w 否 Integer 字幕框宽度 说明: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 表27 LiveEventCallBackConfig

    来自:帮助中心

    查看更多 →

  • 错误码

    检查是否发送end请求,是否关闭客户端。 SIS.0305 语音识别异常。 请重试,或联系技术支持工程师。 SIS.0306 语音识别异常。 请重试,或联系技术支持工程师。 SIS.0307 语音识别异常。 请重试,或联系技术支持工程师。 SIS.0309 实时语音识别音频时长超过最大值。 请注意音频的时

    来自:帮助中心

    查看更多 →

  • 查询分身数字人视频制作任务详情

    字体大小。 取值范围:[4, 120] h Integer 字幕框高度 说明: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数 w Integer 字幕框宽度 说明: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 表11 ShootScriptItem

    来自:帮助中心

    查看更多 →

  • 权限类

    权限类 语音交互 服务需要申请什么权限 如何通过主账号创建一个子账号 语音识别是强制绑定使用OBS进行录音文件存储吗

    来自:帮助中心

    查看更多 →

  • 启动数字人智能直播任务

    取值范围:[4, 120] h 否 Integer 字幕框高度 说明: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数 w 否 Integer 字幕框宽度 说明: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 表6 PlayPolicy

    来自:帮助中心

    查看更多 →

  • 更新视频制作剧本

    取值范围:[4, 120] h 否 Integer 字幕框高度 说明: 参数h用于方便前端计算字幕框左上角坐标,后台不使用该参数 w 否 Integer 字幕框宽度 说明: 字幕框宽度固定为屏幕宽度的80% 参数w用于方便前端计算字幕框左上角坐标,后台不使用该参数 表7 BackgroundMusicConfig

    来自:帮助中心

    查看更多 →

  • Java SDK

    Java SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版

    来自:帮助中心

    查看更多 →

  • Python SDK

    Python SDK 一句话识别Http接口 一句话识别Websocket接口 录音文件识别 实时语音识别 语音合成 热词管理 实时语音合成 录音文件极速版

    来自:帮助中心

    查看更多 →

  • 支持哪些语言

    支持哪些语言 录音文件识别、语音合成支持中文普通话。 一句话识别和实时语音识别支持中文普通话,带方言口音的普通话和方言(四川话、粤语和上海话)。 父主题: 产品咨询类

    来自:帮助中心

    查看更多 →

  • (即将下线)查询托管媒资详情

    表7 SubtitleInfo 参数 参数类型 描述 url String 字幕文件的下载地址 id Integer 字幕文件id type String 字幕文件类型 language String 字幕文件语言种类 表8 File_addr 参数 参数类型 描述 bucket String

    来自:帮助中心

    查看更多 →

  • 信息订阅

    会议媒体质量状态订阅 "InviteResultNotify":邀请结果信息订阅 "RealTimeSubtitleNotify": 实时字幕信息订阅 "WaitingListNotify": 等候室成员列表订阅 confToken 是 String 会控正式Token。 订阅消息示例

    来自:帮助中心

    查看更多 →

  • 视频制作

    作体验。 单击“确定”,可关闭页面。 图标 调整视频播报的音量。 图标 单击图标可开启字幕展示,并可在画布左侧设置字幕的字体、大小和位置等。 “音频驱动”方式目前仅支持中文普通话的场景开启字幕。 图标 展示当前视频的宽高比。 图标 第一次单击可折叠“文本驱动/视频驱动”,第二次单击后恢复展示。

    来自:帮助中心

    查看更多 →

  • CPP SDK(Windows)

    CPP SDK(Windows) 使用实时语音识别 使用实时语音合成

    来自:帮助中心

    查看更多 →

  • CPP SDK(Linux)

    CPP SDK(Linux) 使用实时语音识别 使用实时语音合成

    来自:帮助中心

    查看更多 →

  • 什么是语音交互服务

    语音交互服务(Speech Interaction Service,简称SIS)是一种人机交互方式,用户通过实时访问和调用API获取语音交互结果。例如用户通过语音识别功能,将口述音频或者语音文件识别成可编辑的文本,同时也支持通过语音合成功能将文本转换成逼真的语音等提升用户体验。适用场景如语音客服质检、

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了