更新时间:2024-09-06 GMT+08:00

准备数据

数据要求

受技术与成本多种因素制约,文字识别服务存在一些约束限制。

以护照识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制

  • 支持各国护照识别,根据护照首页下方的机读码提取信息。
  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
  • 图像各边的像素大小在15到4096px之间。
  • 图像中护照首页区域有效占比超过25%,保证护照首页内容及其边缘包含在图像内。
  • 支持图像中护照任意角度的水平旋转。
  • 支持少量扭曲,扭曲后图像中的护照长宽比与实际护照相差不超过10%。
  • 能处理反光、暗光等干扰的图片但影响识别精度。

数据传入方式

使用OCR API或SDK时,数据主要通过以下两种方法传入。

  • image

    传入图片的base64编码。

    您可以通过在线转码工具,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。

  • url
    传入图片的url路径。
    • 使用公网http/https url,例如https://support.huaweicloud.com/intl/zh-cn/api-ocr/zh-cn_image_0288040512.png
    • 将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的url。使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限