对接OCR实现图片上文字识别功能
背景信息
文字识别(Optical Character Recognition,简称OCR)以开放API的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。
在AstroZero中,通过应用与华为OCR(Optical Character Recognition)对接,可实现图片或扫描件中文字识别功能。
场景描述
识别某用户上传到华为OBS上的身份证图片的全部信息。
新建OCR连接器
- 参考创建连接器入口中操作,进入创建连接器页面。
- 在左侧列表中,选择“AI > OCR”,单击“+”。
图1 新建OCR连接器
- 设置OCR对接参数,单击“保存”。
图2 创建OCR
- (可选)测试是否能识别身份证照片。
- 在连接器详情页面,单击“测试”。
- “选择类型”配置为“图片URL”或“图片文件”,输入图片URL或选择身份证图片,单击“测试”。
图3 配置身份证
提示如下信息,表明成功识别身份证信息。
图4 测试成功
在脚本中调用连接器
在脚本中,调用连接器实现与OCR的对接。
- 参考开发一个简单脚本实例中操作,创建一个空白脚本。
图5 新建一个空白脚本
- 在脚本编辑器中,输入如下代码。
//导入该脚本所依赖的标准库文件,ocr是系统预置的标准库。 import * as ocr from 'ocr'; let cli = ocr.newClient("OCR_Test"); try { let url = "https://obs.example.com:443/1.PNG?AccessKeyId=ZK87UUIONJF5ZHWBINUO&Expires=1556001233&Signature=DOwO6djb4Q3EBvCieQFaO3T2GKU%3D&x-obs-security-token=gQpjbi1ub3J0aC0xipYOeC2mcbefHh5I_aMr6DEWQ8-iFyxqatavdiFtYowH-lpJCcxeTynsV_4PTJe9QIx85mlDIDo3sU9PUv3hFtRjQORjGE2PqA4hEtozvMuWxXb5b6RKiFT37-z7NoI4R85XmlTmZGQ6OUZ92bercG5DWEBTDVd3I_UYuNGzF20q6S2COP__Z-uqkhhw8nATd3k6GaIfCqxjcOih_juHBBoM1ON74vpKxCl1sJxnEYbZfkf6FO_xuGaJD7-J7OzD8tsSmFf4jR1TqZFZzrPEc9bkd2bPr8pwOCdDp8Yy0EVauKDvtIXsvzFollOR0rUvZol1sIsQU0gVpFpZyIqYqG6C_qQfXmr5DQwXTsQyifKjXLSj2MbPs6FKLYqu7mj0NhxUVcK5EQh5Vl5x5VHvYGRwgWJL078oXVBKGnQnr05EDHcCiW-6Gris2mHBYdcNmuhJ1UwNekeumBc0S6_33yK-U8OGYLMpR6HnLooyFmtmnOBIIQIkzWfWUNM7nIdWWcPmozJcBZ8iyawE0Cxgz5Xf56hPi-YZda0d1Xu387GA8PBkEPVct1yo5nh2bmVfRH6z0zWzhN-vbFcIHsfYv776DDLKQdSH0Sn-8bHdvPLPd2QieBkgS6wfvTcKMeBA6PwwNBl0Xqds6vQPpSZe6cYyplNuJoY05VLd8tLZMy_bR8Dmf1kArQaSquBzw2eDCfJAazjA4wTnkbccr38k7eM%3D" let resp = cli.idCardWithURL(url, "front"); console.log(resp); } catch (e) { console.log("error: ", e) }
其其中,ocr.newClient("OCR_Test")中,“OCR_Test”为连接器的名称,“url”取值是图片的URL, “front”表示识别的是身份证正面。
- 单击脚本编辑器页面上方的,保存脚本。
- 保存成功后,单击,运行脚本。
- 不用设置输入参数,直接单击测试窗口右上角的。
- 在输出参数页签,检查是否识别出身份证上文字信息。
识别出身份证上的文字信息,表明成功调用连接器。
- 单击脚本编辑器页面上方的,启用脚本。
在服务编排中调用连接器
在服务编排中,调用连接器实现与OCR的对接。
- 参考如何开发服务编排中操作,创建一个空白的服务编排。
图6 创建一个空白的服务编排
- 在服务编排设计页面,从左侧“连接器 > AI”中,拖拽“OCR”图元至画布中。
OCR是系统预置的,与OCR对接的接口。
图7 拖拽OCR图元到画布中
- 选中组件,单击,设置OCR对接信息。
图8 设置基本信息
- 标签:图元在页面展示的名称。
- 名称:图元在系统中的唯一标识,不能和其他图元相同。
- 连接器:服务编排使用的连接器的名称。
- 单击,设置动作参数。
图9 设置动作参数
- 动作:系统提供了如下两个动作。
- id_card_with_url:根据图片的URL路径,识别身份证。目前仅支持华为云上,OBS提供的临时授权或匿名公开授权访问的URL。
- id_card_with_image:根据base64编码后的图像数据,识别身份证。要求base64编码后大小不超过10M,图像各边的像素大小在15到8000之间,图片格式为JPG、PNG、BMP或TIFF。
- 输入参数
- 当动作为“id_card_with_url”时,输入参数说明如下:
- “目标”取值为“url”时:请在“源”中,配置图片的URL路径,目前仅支持华为云上OBS提供的临时授权或者匿名公开授权访问的URL。
- “目标”取值为“side”时:请在“源”中,配置身份证正面还是反面,“源”配置为“front”,表示为身份证正面,配置为“back”,表示为身份证背面。
- 当动作为“id_card_with_image”时,输入参数说明如下:
- “目标”取值为“image”时:请在“源”中,配置base64编码后的图像数据。要求base64编码后大小不超过10M,图像各边的像素大小在15到8000之间,图片格式为JPG、PNG、BMP或TIFF。
- “目标”取值为“side”时:请在“源”中,配置身份证正面还是反面,“源”配置为“front”,表示为身份证正面,配置为“back”,表示为身份证背面。
- 当动作为“id_card_with_url”时,输入参数说明如下:
- 输出参数
- “源”设置为“result”,“目标”用于调用成功时的调用结果。必须定义一个如下表的结构变量,来进行接收。
表1 result结构体成员变量说明 名称
类型
说明
name
String
姓名。
sex
String
性别。
birth
String
出生日期。
ethnicity
String
民族。
address
String
地址。
number
String
身份证号。
issue
String
发证机关。
valid_from
String
有效起始日期。
valid_to
String
有效结束日期。
- “源”设置为“error”,“目标”用于调用失败时的错误码。
- “源”设置为“result”,“目标”用于调用成功时的调用结果。必须定义一个如下表的结构变量,来进行接收。
- 动作:系统提供了如下两个动作。
- 连接开始图元和OCR图元。
图10 连接图元
- 单击页面上方的,保存服务编排。
- 保存成功后,单击,运行服务编排。
若输出身份证识别信息,表示成功调用连接器。
- 单击页面上方的,启用服务编排。