文档首页/ 文字识别 OCR/ 用户指南/ 准备数据

更新时间：2025-06-12 GMT+08:00

准备数据

数据要求

受技术与成本多种因素制约，文字识别服务存在一些约束限制。

以通用文字识别API为例，输入数据存在以下约束。其他API的的使用约束请参见约束与限制。

只支持识别PNG、JPG、JPEG、BMP、TIFF格式的图片。
图像各边的像素大小在15px到8192px之间。
图像中识别区域有效占比超过80%，保证所有文字及其边缘包含在图像内。
支持图像任意角度的水平旋转。
目前不支持复杂背景（如户外自然场景、防伪水印等）和文字扭曲图像的文字识别。

数据传入方式

使用OCR API或SDK时，数据主要通过以下两种方法传入。

image
传入图片的base64编码。

您可以通过在线转码工具，浏览器，使用Python中的base64.b64encode函数等方法，获取图片的base64编码。
url
传入图片的url路径。
- 使用公网http/https url，例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0288038400.png
- 将图片上传至华为云对象存储服务（OBS）中，使用OBS提供的url。使用OBS数据需要进行授权。包括对服务授权、临时授权、匿名公开授权，详情参见配置OBS访问权限。

上一篇：开通服务

下一篇：自定义OCR

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问