文档首页 > > SDK参考> Python SDK> 使用一句话识别

使用一句话识别

分享
更新时间: 2019/12/04 GMT+08:00

前提条件

  • 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。
  • 确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。

初始化Client

初始化AsrCustomizationClient详见表 AsrCustomizationClient初始化参数

表1 AsrCustomizationClient初始化参数

参数名称

是否必选

参数类型

描述

ak

String

用户的ak,可参考AK/SK认证

sk

String

用户的sk,可参考AK/SK认证

region

String

区域,如:cn-north-1。具体请参考终端节点

project_id

String

项目ID,同region一一对应,参考获取项目ID

service_endpoint

String

终端节点,一般使用默认即可。

sis_config

Object

详见表 SisConfig数据结构

表2 SisConfig数据结构

参数名称

是否必选

参数类型

描述

connect_timeout

String

连接超时,默认10,单位s。

read_timeout

String

读取超时,默认10,单位s。

proxy

List

[host, port] 或 [host, port, username, password]。

请求参数

请求类为AsrCustomShortRequest,详见表 AsrCustomShortRequest数据结构

表3 AsrCustomShortRequest数据结构

参数名称

是否必选

参数类型

描述

data

String

本地音频文件经过Base64编码后的字符串,音频文件时长不超过1min。

audio_format

String

音频格式,具体信息请参见《API参考》中一句话识别章节。

model_property

String

属性字符串,语言_采样率_模型,如chinese_8k_common。具体信息请参见《API参考》中一句话识别章节。

add_punc

String

yes 或 no,识别结果是否添加标点,默认no。

vocabulary_id

String

热词表id,不使用则不填写。

创建热词表请参考《API参考》中创建热词表章节。

响应参数

Python SDK响应结果为Json格式,表 响应结果数据结构

表4 响应结果数据结构

参数名称

是否必选

参数类型

描述

result

Object

详见表 result数据结构

trace_id

String

用于后台日志问题追溯。

表5 result数据结构

参数名称

是否必选

参数类型

描述

text

String

识别结果。

score

Float

识别结果置信度评分。

代码示例

# -*- coding: utf-8 -*-

from huaweicloud_sis.client.asr_client import AsrCustomizationClient
from huaweicloud_sis.bean.asr_request import AsrCustomShortRequest
from huaweicloud_sis.bean.asr_request import AsrCustomLongRequest
from huaweicloud_sis.exception.exceptions import ClientException
from huaweicloud_sis.exception.exceptions import ServerException
from huaweicloud_sis.utils import io_utils
from huaweicloud_sis.bean.sis_config import SisConfig
import json
import time

# 鉴权参数
ak = ''             # 参考https://support.huaweicloud.com/sdkreference-sis/sis_05_0003.html
sk = ''             # 参考https://support.huaweicloud.com/sdkreference-sis/sis_05_0003.html
region = ''         # region,如cn-north-4
project_id = ''     # 同region一一对应,参考https://support.huaweicloud.com/api-sis/sis_03_0008.html

# 一句话识别参数,以音频文件的base64编码传入,1min以内音频
path = ''                   # 文件位置
path_audio_format = ''      # 音频格式,详见api文档
path_property = ''          # language_sampleRate_domain, 如chinese_8k_common,详见api文档


def asrc_short_example():
    """ 一句话识别示例 """
    # step1 初始化客户端
    config = SisConfig()
    config.set_connect_timeout(5)       # 设置连接超时
    config.set_read_timeout(10)         # 设置读取超时
    # 设置代理,使用代理前一定要确保代理可用。 代理格式可为[host, port] 或 [host, port, username, password]
    # config.set_proxy(proxy)
    asr_client = AsrCustomizationClient(ak, sk, region, project_id,  sis_config=config)

    # step2 构造请求
    data = io_utils.encode_file(path)
    asr_request = AsrCustomShortRequest(path_audio_format, path_property, data)
    # 所有参数均可不设置,使用默认值
    # 设置是否添加标点,yes or no,默认no
    asr_request.set_add_punc('yes')
    # 设置是否添加热词表id,没有则不填
    # asr_request.set_vocabulary_id(None)

    # step3 发送请求,返回结果,返回结果为json格式
    result = asr_client.get_short_response(asr_request)
    print(json.dumps(result, indent=2, ensure_ascii=False))


if __name__ == '__main__':
    try:
        asrc_short_example()        # 一句话识别
    except ClientException as e:
        print(e)
    except ServerException as e:
        print(e)
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

跳转到云社区