文档首页 > > SDK参考> Python SDK> 使用一句话识别

使用一句话识别

分享
更新时间: 2020/08/10 GMT+08:00

前提条件

  • 确保已按照配置Python环境配置完毕,Python SDK仅支持Python3。
  • 确保已存在待识别的音频文件。如果需要请在下载的SDK压缩包中获取示例音频。

初始化Client

初始化AsrCustomizationClient详见表 AsrCustomizationClient初始化参数

表1 AsrCustomizationClient初始化参数

参数名称

是否必选

参数类型

描述

ak

String

用户的ak,可参考AK/SK认证

sk

String

用户的sk,可参考AK/SK认证

region

String

区域,如cn-north-4,参考终端节点

project_id

String

项目ID,同region一一对应,参考获取项目ID

service_endpoint

String

终端节点,一般使用默认即可。

sis_config

Object

详见表 SisConfig数据结构

表2 SisConfig数据结构

参数名称

是否必选

参数类型

描述

connect_timeout

Integer

连接超时,默认10,单位s。

read_timeout

Integer

读取超时,默认10,单位s。

proxy

List

[host, port] 或 [host, port, username, password]。

请求参数

请求类为AsrCustomShortRequest,详见表 AsrCustomShortRequest数据结构

表3 AsrCustomShortRequest数据结构

参数名称

是否必选

参数类型

描述

data

String

本地音频文件经过Base64编码后的字符串,音频文件时长不超过1min。

audio_format

String

音频格式,具体信息请参见《API参考》中一句话识别章节。

model_property

String

属性字符串,语言_采样率_模型,如chinese_8k_common。具体信息请参见《API参考》中一句话识别章节。

add_punc

String

表示是否在识别结果中添加标点,取值为yes 、 no,默认no。

digit_norm

String

表示是否将语音中的数字识别为阿拉伯数字,取值为yes 、 no,默认为yes。

vocabulary_id

String

热词表id,不使用则不填写。

创建热词表请参考《API参考》中创建热词表章节。

响应参数

Python SDK响应结果为Json格式,表 响应结果数据结构

表4 响应结果数据结构

参数名称

是否必选

参数类型

描述

result

Object

详见表 result数据结构

trace_id

String

用于后台日志问题追溯。

表5 result数据结构

参数名称

是否必选

参数类型

描述

text

String

识别结果。

score

Float

识别结果置信度评分。

代码示例

# -*- coding: utf-8 -*-

from huaweicloud_sis.client.asr_client import AsrCustomizationClient
from huaweicloud_sis.bean.asr_request import AsrCustomShortRequest

from huaweicloud_sis.exception.exceptions import ClientException
from huaweicloud_sis.exception.exceptions import ServerException
from huaweicloud_sis.utils import io_utils
from huaweicloud_sis.bean.sis_config import SisConfig
import json


# 鉴权参数
ak = ''             
sk = ''             
region = ''         # region,如cn-north-4
project_id = ''     # 同region一一对应。登录管理控制台,鼠标移动到右上角的用户名上,在下拉列表中选择我的凭证。在我的凭证页面,可以查看用户名、账号名,在项目列表中查看项目。多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。
# 一句话识别参数,以音频文件的base64编码传入,1min以内音频
path = ''                   # 文件位置,需要具体到音频文件,如D:/test.wav
path_audio_format = ''      # 音频格式,如wav,详见API文档
path_property = ''          # language_sampleRate_domain, 如chinese_8k_common,详见API文档


def asrc_short_example():
    """ 一句话识别示例 """
    # step1 初始化客户端
    config = SisConfig()
    config.set_connect_timeout(10)       # 设置连接超时
    config.set_read_timeout(10)         # 设置读取超时
    # 设置代理,使用代理前一定要确保代理可用。 代理格式可为[host, port] 或 [host, port, username, password]
    # config.set_proxy(proxy)
    asr_client = AsrCustomizationClient(ak, sk, region, project_id,  sis_config=config)

    # step2 构造请求
    data = io_utils.encode_file(path)
    asr_request = AsrCustomShortRequest(path_audio_format, path_property, data)
    # 所有参数均可不设置,使用默认值
    # 设置是否添加标点,yes or no,默认no
    asr_request.set_add_punc('yes')
    # 设置是否将语音中数字转写为阿拉伯数字,yes or no,默认yes
    asr_request.set_digit_norm('no')
    # step3 发送请求,返回结果,返回结果为json格式
    result = asr_client.get_short_response(asr_request)
    print(json.dumps(result, indent=2, ensure_ascii=False))


if __name__ == '__main__':
    try:
        asrc_short_example()        # 一句话识别
    except ClientException as e:
        print(e)
    except ServerException as e:
        print(e)
分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!

非常感谢您的反馈,我们会继续努力做到更好!

反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问