更新时间:2024-07-23 GMT+08:00
分享

对接OCR实现图片上文字识别功能

背景信息

文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。

在AstroZero中,通过应用与华为OCR(Optical Character Recognition)对接,可实现图片或扫描件中文字识别功能。

场景描述

识别某用户上传到华为OBS上的身份证图片的全部信息。

前提条件

  • 已申请身份证识别服务,具体操作请参见开通文字识别服务

  • 已获取AK(Access Key ID)、SK(Secret Access Key),即访问密钥对,具体操作请参见获取AK/SK
  • 已将身份证照片上传到华为云的OBS存储桶上,并获取到图片的URL,具体操作请参见如何上传文件

新建OCR连接器

  1. 参考创建连接器入口中操作,进入创建连接器页面。
  2. 在左侧列表中,选择“AI > OCR”,单击“+”。

    图1 新建OCR连接器

  3. 设置OCR对接参数,单击“保存”。

    图2 创建OCR
    • 名称:连接器的名称。
    • 区域:OCR服务的区域。
    • 访问密钥:访问密钥ID,与私有访问密钥关联的唯一标识符,访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。配置为前提条件中的“AK”的值。
    • 密钥:私有访问密钥,与访问密钥ID结合使用的密钥,对请求进行加密签名,可标识发送方,并防止请求被修改。请与前提条件中的“SK”的值。
    • 打包当前配置:默认为选中,对信息敏感的场景,建议不勾选。

      选中该选项后,应用打包时会将当前配置的连接器信息一并打出。例如,如果应用包发布到运行环境,当前配置默认会被同步到运行环境中。

  4. (可选)测试是否能识别身份证照片。

    1. 在连接器详情页面,单击“测试”。
    2. “选择类型”配置为“图片URL”或“图片文件”,输入图片URL或选择身份证图片,单击“测试”。
      图3 配置身份证

      提示如下信息,表明成功识别身份证信息。

      图4 测试成功

在脚本中调用连接器

在脚本中,调用连接器实现与OCR的对接。

  1. 参考开发一个简单脚本实例中操作,创建一个空白脚本。

    图5 新建一个空白脚本

  2. 在脚本编辑器中,输入如下代码。

    //导入该脚本所依赖的标准库文件,ocr是系统预置的标准库。
    import * as ocr from 'ocr';
     
    let cli = ocr.newClient("OCR_Test");
    try {
        let url = "https://obs.example.com:443/1.PNG?AccessKeyId=ZK87UUIONJF5ZHWBINUO&Expires=1556001233&Signature=DOwO6djb4Q3EBvCieQFaO3T2GKU%3D&x-obs-security-token=gQpjbi1ub3J0aC0xipYOeC2mcbefHh5I_aMr6DEWQ8-iFyxqatavdiFtYowH-lpJCcxeTynsV_4PTJe9QIx85mlDIDo3sU9PUv3hFtRjQORjGE2PqA4hEtozvMuWxXb5b6RKiFT37-z7NoI4R85XmlTmZGQ6OUZ92bercG5DWEBTDVd3I_UYuNGzF20q6S2COP__Z-uqkhhw8nATd3k6GaIfCqxjcOih_juHBBoM1ON74vpKxCl1sJxnEYbZfkf6FO_xuGaJD7-J7OzD8tsSmFf4jR1TqZFZzrPEc9bkd2bPr8pwOCdDp8Yy0EVauKDvtIXsvzFollOR0rUvZol1sIsQU0gVpFpZyIqYqG6C_qQfXmr5DQwXTsQyifKjXLSj2MbPs6FKLYqu7mj0NhxUVcK5EQh5Vl5x5VHvYGRwgWJL078oXVBKGnQnr05EDHcCiW-6Gris2mHBYdcNmuhJ1UwNekeumBc0S6_33yK-U8OGYLMpR6HnLooyFmtmnOBIIQIkzWfWUNM7nIdWWcPmozJcBZ8iyawE0Cxgz5Xf56hPi-YZda0d1Xu387GA8PBkEPVct1yo5nh2bmVfRH6z0zWzhN-vbFcIHsfYv776DDLKQdSH0Sn-8bHdvPLPd2QieBkgS6wfvTcKMeBA6PwwNBl0Xqds6vQPpSZe6cYyplNuJoY05VLd8tLZMy_bR8Dmf1kArQaSquBzw2eDCfJAazjA4wTnkbccr38k7eM%3D"
        let resp = cli.idCardWithURL(url, "front");
        console.log(resp);
    } catch (e) {
        console.log("error: ", e)
    }

    其其中,ocr.newClient("OCR_Test")中,“OCR_Test”为连接器的名称,“url”取值是图片的URL, “front”表示识别的是身份证正面。

  3. 单击脚本编辑器页面上方的,保存脚本。
  4. 保存成功后,单击,运行脚本。
  5. 不用设置输入参数,直接单击测试窗口右上角的
  6. 在输出参数页签,检查是否识别出身份证上文字信息。

    识别出身份证上的文字信息,表明成功调用连接器。

  7. 单击脚本编辑器页面上方的,启用脚本。

在服务编排中调用连接器

在服务编排中,调用连接器实现与OCR的对接。

  1. 参考如何开发服务编排中操作,创建一个空白的服务编排。

    图6 创建一个空白的服务编排

  2. 在服务编排设计页面,从左侧“连接器 > AI”中,拖拽“OCR”图元至画布中。

    OCR是系统预置的,与OCR对接的接口。

    图7 拖拽OCR图元到画布中

  3. 选中组件,单击,设置OCR对接信息。

    图8 设置基本信息
    • 标签:图元在页面展示的名称。
    • 名称:图元在系统中的唯一标识,不能和其他图元相同。
    • 连接器:服务编排使用的连接器的名称。

  4. 单击,设置动作参数。

    图9 设置动作参数
    • 动作:系统提供了如下两个动作。
      • id_card_with_url:根据图片的URL路径,识别身份证。目前仅支持华为云上,OBS提供的临时授权或匿名公开授权访问的URL。
      • id_card_with_image:根据base64编码后的图像数据,识别身份证。要求base64编码后大小不超过10M,图像各边的像素大小在15到8000之间,图片格式为JPG、PNG、BMP或TIFF。
    • 输入参数
      • 当动作为“id_card_with_url”时,输入参数说明如下:
        • “目标”取值为“url”时:请在“源”中,配置图片的URL路径,目前仅支持华为云上OBS提供的临时授权或者匿名公开授权访问的URL。
        • “目标”取值为“side”时:请在“源”中,配置身份证正面还是反面,“源”配置为“front”,表示为身份证正面,配置为“back”,表示为身份证背面。
      • 当动作为“id_card_with_image”时,输入参数说明如下:
        • “目标”取值为“image”时:请在“源”中,配置base64编码后的图像数据。要求base64编码后大小不超过10M,图像各边的像素大小在15到8000之间,图片格式为JPG、PNG、BMP或TIFF。
        • “目标”取值为“side”时:请在“源”中,配置身份证正面还是反面,“源”配置为“front”,表示为身份证正面,配置为“back”,表示为身份证背面。
    • 输出参数
      • “源”设置为“result”,“目标”用于调用成功时的调用结果。必须定义一个如下表的结构变量,来进行接收。
        表1 result结构体成员变量说明

        名称

        类型

        说明

        name

        String

        姓名。

        sex

        String

        性别。

        birth

        String

        出生日期。

        ethnicity

        String

        民族。

        address

        String

        地址。

        number

        String

        身份证号。

        issue

        String

        发证机关。

        valid_from

        String

        有效起始日期。

        valid_to

        String

        有效结束日期。

      • “源”设置为“error”,“目标”用于调用失败时的错误码。

  5. 连接开始图元和OCR图元。

    图10 连接图元

  6. 单击页面上方的,保存服务编排。
  7. 保存成功后,单击,运行服务编排。

    若输出身份证识别信息,表示成功调用连接器。

  8. 单击页面上方的,启用服务编排。

相关文档