获取录音文件识别结果 - CollectTranscriberJob

功能介绍

该接口用于获取录音文件识别结果及识别状态。该接口的使用限制请参见约束与限制，详细使用指导请参见SIS服务使用简介章节。

调试

您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。

授权信息

账号具备所有API的调用权限，如果使用账号下的IAM用户调用当前API，该IAM用户需具备调用API所需的权限，具体权限要求请参见权限和授权项。

URI

GET /v1/{project_id}/asr/transcriber/jobs/{job_id}

表1 路径参数
参数	是否必选	参数类型	描述
job_id	是	String	录音文件识别任务标识符。
project_id	是	String	项目编号。获取方法，请参见获取项目ID。

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	是	String	用户Token。用于获取操作API的权限。获取方法请参见认证鉴权。响应消息头中X-Subject-Token的值即为Token。

响应参数

状态码： 200

表3 响应Body参数
参数	是否必选	参数类型	描述
job_id	否	String	录音文件识别任务标识符。使用“callback_url”回调url时，该字段会随结果发送至用户服务器。使用get接口查询，不会出现该字段。
status	否	String	当前识别状态。具体状态如下所示： WAITING 等待识别。 FINISHED 识别已经完成。 ERROR 识别过程中发生错误。
create_time	否	String	任务创建时间，遵循 RFC 3339格式。格式示例：2018-12-04T13:10:29.310Z。
start_time	否	String	开始识别时间，遵循 RFC 3339格式。当status为FINISHED或ERROR时存在。格式示例：2018-12-04T13:10:29.310Z。
finish_time	否	String	识别完成时间，遵循 RFC 3339格式。当status为FINISHED或ERROR时存在。格式示例：2018-12-04T13:10:29.310Z。
audio_duration	否	Integer	提交音频的时长，单位ms。
segments	否	Array of Segment Objects	识别结果, 多句结果的数组。

表4 Segment
参数	是否必选	参数类型	描述
start_time	是	Integer	一句的起始时间戳，单位ms。
end_time	是	Integer	一句的结束时间戳，单位ms。
result	是	TranscriberResult Object	调用成功表示识别结果，调用失败时无此字段。数据结构参见result表。

表5 TranscriberResult
参数	是否必选	参数类型	描述
text	是	String	识别结果文本。
analysis_info	否	AnalysisInfoResult Object	每一句的质检分析结果对象。仅在识别配置中的need_analysis_info不为null时存在该返回结果。数据结构参见analysisinfo数据表。
word_info	否	Array of WordInfo Objects	分词输出列表。

表6 AnalysisInfoResult
参数	是否必选	参数类型	描述
role	否	String	角色类型，目前对于8k音频以及16k双声道音频仅支持 AGENT（座席），USER（用户）。可用于电话质检等场景。对于16k单声道音频，支持多个说话人，取值范围是（speaker1 ~ speaker10），最多支持10个说话人，可用于会议场景。
emotion	否	String	情绪类型，目前仅支持NORMAL（正常），ANGRY（愤怒），UNKNOWN（未知）。在识别配置中emotion为true时存在。
speed	否	Float	语速信息，单位是每秒字数。在识别配置中speed为true时存在。

表7 WordInfo
参数	是否必选	参数类型	描述
start_time	否	Integer	起始时间
end_time	否	Integer	结束时间
word	否	String	分词

状态码： 400

表8 响应Body参数
参数	参数类型	描述
error_code	String	调用失败时的错误码。调用成功时无此字段。
error_msg	String	调用失败时的错误信息。调用成功时无此字段。

请求示例

“endpoint”即调用API的请求地址，不同接口不同区域的“endpoint”不同，具体请参见终端节点。

获取录音文件识别结果

GET https://{endpoint}/v1/1609d8170cd86660a81281e5a3a03f8b/asr/transcriber/jobs/567e6536-a89c-13c3-a882-826321939656

Request header:
X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...

响应示例

状态码：200

成功响应示例

等待识别的响应示例

{
"status": "WAITING",
"create_time": "2018-12-04T13:10:29.310Z"
}

识别完成的响应示例

{
  "status": "FINISHED",
  "create_time": "2018-12-04T13:10:29.310Z",
  "start_time": "2018-12-04T13:16:29.310Z",
  "finish_time": "2018-12-04T13:35:18.310Z",
  "audio_duration":7000,
  "segments":
  [
    {
      "start_time": 100,
      "end_time": 1500,
      "result":
      {
        "text": "第一句结果。",
        "word_info": [
                     {
                        "start_time": 100,
                        "word": "第一"
                    },
                    {
                        "start_time": 800,
                        "end_time": 1000,
                        "word": "句"
                    },
                    {
                        "start_time": 1000,
                         "end_time": 1500,
                         "word": "结果"
                    }
         ],
        "analysis_info":
        {
          "role": "AGENT",
          "emotion": "NORMAL",
          "speed": 5.62
        }
      }
    }
  ]
}

状态码：400

失败响应示例

{
"error_code": "SIS.30006",
"error_msg": "Invalid data found when processing input",
"status": "ERROR",
"create_time": "2019-05-08T11:01:11.411Z",
"start_time": "2019-06-06T15:10:12.423Z",
"finish_time": "2019-06-06T15:10:12.424Z"
}