文档首页> 语音交互服务 SIS> 快速入门> 调用Java SDK实现一句话识别
更新时间:2024-03-05 GMT+08:00

调用Java SDK实现一句话识别

语音交互服务软件开发工具包(SIS SDK)是对语音交互服务提供的REST API进行的封装,用户直接调用语音交互SDK提供的接口函数即可实现使用语音交互业务能力的目的,以简化用户的开发工作。

本章节提供了通过Java SDK调用一句话识别服务的样例,帮助用户快速了解如何使用Java SDK调用华为云SIS服务。具体操作如下所示:

步骤1:配置环境

步骤2:修改配置信息

步骤3:调用一句话识别

准备工作

注册华为帐号并开通华为云,帐号不能处于欠费或冻结状态。

开通服务

语音交互服务的一句话识别当前已商用,无需申请公测。

QPS数量限制:3QPS。

步骤1:配置环境

  1. 下载SIS Java SDK。

    下载地址:https://sis-open-data.obs.ap-southeast-3.myhuaweicloud.com/java/huaweicloud-java-sdk-sis-1.2.0.zip

  2. 准备Java开发环境。
    • Oracle官网下载并安装JDK。版本要求:强烈推荐使用1.8版本。
    • Eclipse官网下载并安装Eclipse IDE for Java Developers最新版本,例如:eclipse-jee-mars-R-win32-x86_64.zip。

    具体操作请参见配置Java环境章节。

  3. 新建SIS Java SDK工程。
    1. 解压eclipse后,直接打开。在主菜单选择Window -> Preferences -> Java -> installed JREs配置正确的JRE路径。
    2. 新建工程,在工程下建立一个文件(New -> Folder),命名为lib。将下载的jar包拷贝至lib中。
    3. 选中新建的工程,单击右键,下拉选择Build Path -> Configure Build Path,在 Java Build Path 对话框中,单击“Libraries ”页签,选择“Add JARs”。在打开的窗口中,选择刚放进lib的jar包。单击“OK”,导入完成。

步骤2:修改配置信息

Java SDK Demo中认证鉴权方式可选AK/SK认证或者Token认证,本示例中使用AK/SK认证。
  1. 获取AK/SK。

    AK/SK即访问秘钥,请登录我的凭证界面,选择“管理访问密钥 > 新增访问密钥”获取。

  2. AK/SK认证鉴权,配置Java SDK中的AK/SK。

    根据获取的AK/SK,修改Demo工程“AsrCustomizationDemo.java”文件中函数的“AK”和“SK”的值。

  3. 设置SDK中demo文件夹下的示例文件AsrCustomizationDemo.java相关参数,参数说明具体请参考表1表2表3参数说明。
    import com.huawei.sis.bean.SisConfig;
    import com.huawei.sis.bean.SisConstant;
    import com.huawei.sis.bean.request.AsrCustomLongRequest;
    import com.huawei.sis.bean.response.AsrCustomLongResponse;
    import com.huawei.sis.bean.request.AsrCustomShortRequest;
    import com.huawei.sis.bean.response.AsrCustomShortResponse;
    import com.huawei.sis.bean.AuthInfo;
    import com.huawei.sis.bean.base.AsrcLongAnalysisInfo;
    import com.huawei.sis.bean.base.AsrcLongSentence;
    import com.huawei.sis.client.AsrCustomizationClient;
    import com.huawei.sis.exception.SisException;
    import com.huawei.sis.util.IOUtils;
    
    import java.util.List;
    
    /**
     * 一句话识别
     *
     * Copyright 2019 Huawei Technologies Co.,Ltd.
     */
    public class AsrCustomizationDemo {
      private static final int SLEEP_TIME = 500;
      private static final int MAX_POLLING_NUMS = 1000;
    
      // 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全;
      // 本示例以ak和sk保存在环境变量中来实现身份验证为例,运行本示例前请先在本地环境中设置环境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。
      private String ak = System.getenv("HUAWEICLOUD_SDK_AK");		
      private String sk = System.getenv("HUAWEICLOUD_SDK_SK");
      private String region = "";    // 区域
      private String projectId = ""; // 项目id。登录管理控制台,鼠标移动到右上角的用户名上,在下拉列表中选择我的凭证。在我的凭证页面,可以查看用户名、账号名,在项目列表中查看项目。多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。
      // 一句话识别参数
      private String path = "";             // 文件路径,一句话识别目前仅支持上传音频文件的base64编码
      private String pathAudioFormat = "";  // 文件格式,如wav等
      private String pathProperty = "";     // 属性字符串,language_sampleRate_domain。
    
      private void setShortParameter(AsrCustomShortRequest request) {
    
        // 设置是否添加标点,默认是no
        request.setAddPunc("yes");
      }
    
      private SisConfig getConfig() {
        SisConfig config = new SisConfig();
        // 设置连接超时,默认10000ms
        config.setConnectionTimeout(SisConstant.DEFAULT_CONNECTION_TIMEOUT);
        // 设置请求超时,默认10000ms
        config.setRequestTimeout(SisConstant.DEFAULT_CONNECTION_REQUEST_TIMEOUT);
        // 设置socket超时,默认10000ms
        config.setSocketTimeout(SisConstant.DEFAULT_SOCKET_TIMEOUT);
        // 设置代理, 一定要确保代理可用才启动此设置。 代理初始化也可用不加密的代理,new ProxyHostInfo(host, port);
        // ProxyHostInfo proxy = new ProxyHostInfo(host, port, username, password);
        // config.setProxy(proxy);
        return config;
      }
    
      private void printAsrShortResponse(AsrCustomShortResponse response) {
        System.out.println("traceId=" + response.getTraceId());
        System.out.println("text=" + response.getText());
        System.out.println("score=" + response.getScore());
        System.out.println("\n");
      }
    
      /**
       * 一句话识别demo。
       */
      private void shortDemo() {
        try {
          // 1. 初始化AsrCustomizationClient
          // 定义authInfo,根据ak,sk,region,projectId
          AuthInfo authInfo = new AuthInfo(ak, sk, region, projectId);
          // 设置config,主要与超时有关
          SisConfig config = getConfig();
          // 根据authInfo和config,构造AsrCustomizationClient
          AsrCustomizationClient asr = new AsrCustomizationClient(authInfo, config);
    
          // 2. 配置请求
          String data = IOUtils.getEncodeDataByPath(path);
          AsrCustomShortRequest request = new AsrCustomShortRequest(data, pathAudioFormat, pathProperty);
          // 设置请求参数,所有参数均为可选
          setShortParameter(request);
    
          // 3. 发送请求,获取响应
          AsrCustomShortResponse response = asr.getAsrShortResponse(request);
          // 打印结果
          printAsrShortResponse(response);
    
        } catch (SisException e) {
          e.printStackTrace();
          System.out.println("error_code:" + e.getErrorCode() + "\nerror_msg" + e.getErrorMsg());
        }
      }
    
      public static void main(String[] args) {
        AsrCustomizationDemo demo = new AsrCustomizationDemo();
        // 选择1 一句话识别
        demo.shortDemo();
      }
    
    }
    
    表1 用户信息

    参数名称

    是否必选

    参数说明

    AK

    必选

    用户的AK,获取AK、SK参考AK/SK认证

    SK

    必选

    用户的SK,获取AK、SK参考AK/SK认证

    Region

    必选

    服务所在区域。

    ProjectId

    必选

    项目ID,同Region一一对应,参考获取项目ID

    Endpoint

    可选

    终端节点,可不填,使用默认即可。

    表2 config配置参数

    参数名称

    是否必选

    参数说明

    SocketTimeout

    可选

    Socket超时,默认10000,单位ms。

    ConnectionTimeout

    可选

    连接超时,默认10000,单位ms。

    RequestTimeout

    可选

    请求超时,默认10000,单位ms。

    Proxy

    可选

    使用前务必确认代理能否可用,最好避免使用代理。

    表3 请求参数

    参数名称

    是否必选

    参数说明

    Data

    必选

    本地音频文件经过Base64编码后的字符串。

    AudioFormat

    必选

    音频格式。

    Property

    必选

    属性字符串,语言_采样率_模型,如chinese_8k_common。具体信息请参见《API参考》一句话识别

    Add_punc

    可选

    “yes”“no”,识别结果是否添加标点,默认“no”

步骤3:调用一句话识别

执行AsrCustomizationDemo.java文件,可查看返回结果,显示如下。
{
    "trace_id": "7f0ba401-d82d-4bfb-8ae7-600bf54ce4f6",
    "result": {
        "text": "欢迎来到xx公司。",
        "score": 0.06588845654993515
    }
}