文档首页/ 文字识别 OCR/ 产品介绍/ 什么是文字识别
更新时间:2023-11-13 GMT+08:00

什么是文字识别

文字识别(Optical Character Recognition,简称OCR)是指将图片中的打印字符进行检测识别成可编辑的文本格式,以JSON格式返回识别结果。

OCR以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户使用Python、Java等编程语言调用OCR服务API将图片识别成文字,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率,API获取详情请参考《API参考》。

OCR还提供多种编程语言的SDK供您使用,SDK使用方法请参考《SDK参考》。

使用前必读

用户需要具备编程能力,熟悉Java、Python、iOS、Android、Node.js编程语言。

OCR服务需要用户通过调用API接口,将图片或扫描件中的文字识别成可编辑的文本,然后返回JSON格式的识别结果,用户需要通过编码将识别结果对接到业务系统或保存为TXT、Excel等格式。

OCR能力

  • 通用类 OCR

    通用类OCR(General OCR),支持网络图片等任意格式图片上文字信息的自动化识别,快速实现各种文档电子化。

  • 证件类 OCR

    证件类OCR(Card OCR),支持身份证、驾驶证、护照等证件图片上有效信息的自动识别和关键字段结构化提取。

首次使用OCR

如果您是首次使用OCR的用户,建议您学习并了解如下信息:

  • 功能介绍

    通过功能介绍章节的内容,了解OCR不同类别的文字识别功能,包括通用类文字识别证件类文字识别

  • 入门使用

    OCR以开放API的方式提供给用户,您可以参考《快速入门》学习并使用OCR服务。

  • 使用方式

    如果您是一个开发工程师,熟悉代码编写,想要直接调用OCR服务,您可以参考《API参考》或《SDK参考》获取详情。

  • 由浅入深学习

    您可以参考成长地图,由浅入深学习使用OCR。