更新时间:2024-11-07 GMT+08:00
分享

准备数据

数据要求

受技术与成本多种因素制约,文字识别服务存在一些约束限制。

通用文字识别API为例,输入数据存在以下约束。其他API的的使用约束请参见约束与限制

  • 只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
  • 图像各边的像素大小在15px到8192px之间。
  • 图像中识别区域有效占比超过80%,保证所有文字及其边缘包含在图像内。
  • 支持图像任意角度的水平旋转。
  • 目前不支持复杂背景(如户外自然场景、防伪水印等)和文字扭曲图像的文字识别。

数据传入方式

使用OCR API或SDK时,数据主要通过以下两种方法传入。

  • image

    传入图片的base64编码。

    您可以通过在线转码工具,浏览器,使用Python中的base64.b64encode函数等方法,获取图片的base64编码。

  • url
    传入图片的url路径。
    • 使用公网http/https url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0288038400.png
    • 将图片上传至华为云对象存储服务(OBS)中,使用OBS提供的url。使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权,详情参见配置OBS访问权限

相关文档