更新时间:2024-01-16 GMT+08:00
分享

获取录音文件识别结果

功能介绍

该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制,详细使用指导请参见SIS服务使用简介章节。

调试

您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。

URI

GET /v1/{project_id}/asr/transcriber/jobs/{job_id}

表1 路径参数

参数

是否必选

参数类型

描述

job_id

String

录音文件识别任务标识符。

project_id

String

项目编号。获取方法,请参见获取项目ID

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。

用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。

响应参数

状态码: 200

表3 响应Body参数

参数

是否必选

参数类型

描述

job_id

String

录音文件识别任务标识符。

  • 使用“callback_url”回调url时,该字段会随结果发送至用户服务器。
  • 使用get接口查询,不会出现该字段。

status

String

当前识别状态。具体状态如下所示:

WAITING 等待识别。

FINISHED 识别已经完成。

ERROR 识别过程中发生错误。

create_time

String

任务创建时间,遵循 RFC 3339格式。

格式示例:2018-12-04T13:10:29.310Z。

start_time

String

开始识别时间,遵循 RFC 3339格式。

当status为FINISHED或ERROR时存在。

格式示例:2018-12-04T13:10:29.310Z。

finish_time

String

识别完成时间,遵循 RFC 3339格式。

当status为FINISHED或ERROR时存在。

格式示例:2018-12-04T13:10:29.310Z。

audio_duration

Integer

提交音频的时长,单位ms。

segments

Array of Segment objects

识别结果, 多句结果的数组。

表4 Segment

参数

是否必选

参数类型

描述

start_time

Integer

一句的起始时间戳,单位ms。

end_time

Integer

一句的结束时间戳,单位ms。

result

TranscriberResult object

调用成功表示识别结果,调用失败时无此字段。数据结构参见result表。

表5 TranscriberResult

参数

是否必选

参数类型

描述

text

String

识别结果文本。

analysis_info

AnalysisInfoResult object

每一句的质检分析结果对象。

仅在识别配置中的need_analysis_info不为null时存在该返回结果。数据结构参见analysisinfo数据表。

word_info

Array of WordInfo objects

分词输出列表。

表6 AnalysisInfoResult

参数

是否必选

参数类型

描述

role

String

角色类型,目前对于8k音频以及16k双声道音频仅支持 AGENT(座席),USER(用户)。可用于电话质检等场景。对于16k单声道音频,支持多个说话人,取值范围是(speaker1 ~ speaker10),最多支持10个说话人,可用于会议场景。

emotion

String

情绪类型,目前仅支持NORMAL(正常),ANGRY(愤怒),UNKNOWN(未知)。

在识别配置中emotion为true时存在。

speed

Float

语速信息,单位是每秒字数。

在识别配置中speed为true时存在。

表7 WordInfo

参数

是否必选

参数类型

描述

start_time

Integer

起始时间

end_time

Integer

结束时间

word

String

分词

状态码: 400

表8 响应Body参数

参数

参数类型

描述

error_code

String

调用失败时的错误码。 调用成功时无此字段。

error_msg

String

调用失败时的错误信息。 调用成功时无此字段。

请求示例

“endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点

  • 获取录音文件识别结果
    GET https://{endpoint}/v1/1609d8170cd86660a81281e5a3a03f8b/asr/transcriber/jobs/567e6536-a89c-13c3-a882-826321939656
    
    Request header:
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...

响应示例

状态码:200

成功响应示例

  • 等待识别的响应示例
    {
    "status": "WAITING",
    "create_time": "2018-12-04T13:10:29.310Z"
    }
  • 识别完成的响应示例
    {
      "status": "FINISHED",
      "create_time": "2018-12-04T13:10:29.310Z",
      "start_time": "2018-12-04T13:16:29.310Z",
      "finish_time": "2018-12-04T13:35:18.310Z",
      "audio_duration":7000,
      "segments":
      [
        {
          "start_time": 100,
          "end_time": 1500,
          "result":
          {
            "text": "第一句结果。",
            "word_info": [
                         {
                            "start_time": 100,
                            "word": "第一"
                        },
                        {
                            "start_time": 800,
                            "end_time": 1000,
                            "word": "句"
                        },
                        {
                            "start_time": 1000,
                             "end_time": 1500,
                             "word": "结果"
                        }
             ],
            "analysis_info":
            {
              "role": "AGENT",
              "emotion": "NORMAL",
              "speed": 5.62
            }
          }
        }
      ]
    }

状态码:400

失败响应示例

{
"error_code": "SIS.30006",
"error_msg": "Invalid data found when processing input",
"status": "ERROR",
"create_time": "2019-05-08 T11:01:41Z",
"start_time": "2019-06-06T15:10:12.423Z",
"finish_time": "2019-06-06T15:10:12.424Z"
}

状态码

状态码请参见状态码

错误码

错误码请参见错误码

相关文档