对接OCR实现图片上文字识别功能

背景信息

文字识别（Optical Character Recognition，简称OCR）以开放API的方式提供给用户，用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字，帮助用户自动采集关键数据，打造智能化业务系统，提升业务效率。

在AstroZero中，通过应用与华为OCR（Optical Character Recognition）对接，可实现图片或扫描件中文字识别功能。

场景描述

识别某用户上传到华为OBS上的身份证图片的全部信息。

前提条件

已申请身份证识别服务，具体操作请参见开通文字识别服务。
已获取AK（Access Key ID）、SK（Secret Access Key），即访问密钥对，具体操作请参见获取AK/SK。
已将身份证照片上传到华为云的OBS存储桶上，并获取到图片的URL，具体操作请参见如何上传文件。

新建OCR连接器

参考创建连接器入口中操作，进入创建连接器页面。
在左侧列表中，选择“AI > OCR”，单击“+”。

图1 新建OCR连接器
设置OCR对接参数，单击“保存”。

图2 创建OCR
- 名称：连接器的名称。
- 区域：OCR服务的区域。
- 访问密钥：访问密钥ID，与私有访问密钥关联的唯一标识符，访问密钥ID和私有访问密钥一起使用，对请求进行加密签名。配置为前提条件中的“AK”的值。
- 密钥：私有访问密钥，与访问密钥ID结合使用的密钥，对请求进行加密签名，可标识发送方，并防止请求被修改。请与前提条件中的“SK”的值。
- 打包当前配置：默认为选中，对信息敏感的场景，建议不勾选。
  选中该选项后，应用打包时会将当前配置的连接器信息一并打出。例如，如果应用包发布到运行环境，当前配置默认会被同步到运行环境中。
（可选）测试是否能识别身份证照片。
1. 在连接器详情页面，单击“测试”。
2. “选择类型”配置为“图片URL”或“图片文件”，输入图片URL或选择身份证图片，单击“测试”。
  图3 配置身份证
  
  提示如下信息，表明成功识别身份证信息。
  
  图4 测试成功

在脚本中调用连接器

在脚本中，调用连接器实现与OCR的对接。

参考开发一个简单脚本实例中操作，创建一个空白脚本。

图5 新建一个空白脚本

在脚本编辑器中，输入如下代码。

//导入该脚本所依赖的标准库文件，ocr是系统预置的标准库。
import * as ocr from 'ocr';
 
let cli = ocr.newClient("OCR_Test");
try {
    let url = "https://obs.example.com:443/1.PNG?AccessKeyId=ZK87UUIONJF5ZHWBINUO&Expires=1556001233&Signature=DOwO6djb4Q3EBvCieQFaO3T2GKU%3D&x-obs-security-token=gQpjbi1ub3J0aC0xipYOeC2mcbefHh5I_aMr6DEWQ8-iFyxqatavdiFtYowH-lpJCcxeTynsV_4PTJe9QIx85mlDIDo3sU9PUv3hFtRjQORjGE2PqA4hEtozvMuWxXb5b6RKiFT37-z7NoI4R85XmlTmZGQ6OUZ92bercG5DWEBTDVd3I_UYuNGzF20q6S2COP__Z-uqkhhw8nATd3k6GaIfCqxjcOih_juHBBoM1ON74vpKxCl1sJxnEYbZfkf6FO_xuGaJD7-J7OzD8tsSmFf4jR1TqZFZzrPEc9bkd2bPr8pwOCdDp8Yy0EVauKDvtIXsvzFollOR0rUvZol1sIsQU0gVpFpZyIqYqG6C_qQfXmr5DQwXTsQyifKjXLSj2MbPs6FKLYqu7mj0NhxUVcK5EQh5Vl5x5VHvYGRwgWJL078oXVBKGnQnr05EDHcCiW-6Gris2mHBYdcNmuhJ1UwNekeumBc0S6_33yK-U8OGYLMpR6HnLooyFmtmnOBIIQIkzWfWUNM7nIdWWcPmozJcBZ8iyawE0Cxgz5Xf56hPi-YZda0d1Xu387GA8PBkEPVct1yo5nh2bmVfRH6z0zWzhN-vbFcIHsfYv776DDLKQdSH0Sn-8bHdvPLPd2QieBkgS6wfvTcKMeBA6PwwNBl0Xqds6vQPpSZe6cYyplNuJoY05VLd8tLZMy_bR8Dmf1kArQaSquBzw2eDCfJAazjA4wTnkbccr38k7eM%3D"
    let resp = cli.idCardWithURL(url, "front");
    console.log(resp);
} catch (e) {
    console.log("error: ", e)
}

其其中，ocr.newClient("OCR_Test")中，“OCR_Test”为连接器的名称，“url”取值是图片的URL， “front”表示识别的是身份证正面。

单击脚本编辑器页面上方的，保存脚本。
保存成功后，单击，运行脚本。
不用设置输入参数，直接单击测试窗口右上角的。
在输出参数页签，检查是否识别出身份证上文字信息。

识别出身份证上的文字信息，表明成功调用连接器。
单击脚本编辑器页面上方的，启用脚本。

在服务编排中调用连接器

在服务编排中，调用连接器实现与OCR的对接。

参考如何开发服务编排中操作，创建一个空白的服务编排。

图6 创建一个空白的服务编排
在服务编排设计页面，从左侧“连接器 > AI”中，拖拽“OCR”图元至画布中。

OCR是系统预置的，与OCR对接的接口。

图7 拖拽OCR图元到画布中
选中组件，单击，设置OCR对接信息。

图8 设置基本信息
- 标签：图元在页面展示的名称。
- 名称：图元在系统中的唯一标识，不能和其他图元相同。
- 连接器：服务编排使用的连接器的名称。

单击

，设置动作参数。

图9 设置动作参数

动作：系统提供了如下两个动作。
- id_card_with_url：根据图片的URL路径，识别身份证。目前仅支持华为云上，OBS提供的临时授权或匿名公开授权访问的URL。
- id_card_with_image：根据base64编码后的图像数据，识别身份证。要求base64编码后大小不超过10M，图像各边的像素大小在15到8000之间，图片格式为JPG、PNG、BMP或TIFF。
输入参数
- 当动作为“id_card_with_url”时，输入参数说明如下：
  - “目标”取值为“url”时：请在“源”中，配置图片的URL路径，目前仅支持华为云上OBS提供的临时授权或者匿名公开授权访问的URL。
  - “目标”取值为“side”时：请在“源”中，配置身份证正面还是反面，“源”配置为“front”，表示为身份证正面，配置为“back”，表示为身份证背面。
- 当动作为“id_card_with_image”时，输入参数说明如下：
  - “目标”取值为“image”时：请在“源”中，配置base64编码后的图像数据。要求base64编码后大小不超过10M，图像各边的像素大小在15到8000之间，图片格式为JPG、PNG、BMP或TIFF。
  - “目标”取值为“side”时：请在“源”中，配置身份证正面还是反面，“源”配置为“front”，表示为身份证正面，配置为“back”，表示为身份证背面。

输出参数

“源”设置为“result”，“目标”用于调用成功时的调用结果。必须定义一个如下表的结构变量，来进行接收。

表1 result结构体成员变量说明
名称	类型	说明
name	String	姓名。
sex	String	性别。
birth	String	出生日期。
ethnicity	String	民族。
address	String	地址。
number	String	身份证号。
issue	String	发证机关。
valid_from	String	有效起始日期。
valid_to	String	有效结束日期。