更新时间:2022-04-26 GMT+08:00
分享

创建热词表

在一句话识别、录音文件识别、实时语音识别服务中,如果在您的业务领域有一些特有的词,默认识别效果差的时候可以考虑使用热词管理功能,将这些词添加到词表,改善识别效果。

热词可以是姓名、公司名、某个领域的专有名词,如人名"王晓茗”(通常会识别为"王小明”)、运输域的“高栏”等。热词不建议太长,也不要有标点符号或者特殊符号。具体限制参见创建热词表更新热词表章节。

功能介绍

新建一个热词表,创建成功返回id。每个用户限制创建10个热词表。详细使用指导请参见SIS服务使用简介章节。

调试

您可以在API Explorer中调试该接口。

URI

POST /v1/{project_id}/asr/vocabularies

表1 路径参数

参数

是否必选

参数类型

描述

project_id

String

项目编号。获取方法,请参见获取项目ID

请求参数

表2 请求Header参数

参数

是否必选

参数类型

描述

X-Auth-Token

String

用户Token。

Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限,响应消息头中X-Subject-Token的值即为Token。

表3 请求Body参数

参数

是否必选

参数类型

描述

name

String

热词表名,不可重复。内容限制为字母,数字,下中划线和井号,长度不超过32字节。

description

String

热词表描述,长度不超过255字节。

language

String

热词表语言类型。

language取值:chinese_mandarin,表示汉语普通话。

contents

Array of String

支持中英混编热词,单个热词只能由英文字母和unicode编码的汉字组成,不能有其他符号,包括空格。

阿拉伯数字需写成汉字或英文(如“一”、“one”)。

单词库支持热词数上限1024。

单个热词长度上限32字节。

响应参数

状态码: 200

表4 响应Body参数

参数

是否必选

参数类型

描述

vocabulary_id

String

调用成功返回热词表ID,调用失败时无此字段

状态码: 400

表5 响应Body参数

参数

参数类型

描述

error_code

String

调用失败时的错误码。 调用成功时无此字段。

error_msg

String

调用失败时的错误信息。 调用成功时无此字段。

请求示例

“endpoint”即调用API的请求地址,不同服务不同区域的“endpoint”不同,具体请参见终端节点

  • 请求示例
    POST https://{endpoint}/v1/{project_id}/asr/vocabularies
    
    Request Header:
    Content-Type: application/json
    X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG...   
    
    Request Body:
    { 
      "name": "telepower",
      "description": "telepower 具体描述",
      "language": "chinese_mandarin", 
      "contents": ["示例"]
    } 
    

响应示例

状态码: 200

成功响应示例

{ 
  "vocabulary_id": "CFD08A32-6176-4ad7-92F9-11ED015C8109", 
}

状态码:400

失败响应示例

{ 
    "error_code":"SIS.0201", 
    "error_msg":"***" 
}

状态码

状态码请参见状态码

错误码

错误码请参见错误码

分享:

    相关文档

    相关产品

close