文档首页/ 文字识别 OCR/ SDK参考/ 文字识别SDK简介
更新时间:2024-09-04 GMT+08:00

文字识别SDK简介

文字识别SDK概述

文字识别(Optical Character Recognition,简称OCR)将图片或扫描件中的文字识别成可编辑的文本。可代替人工录入,提升业务效率。

文字识别以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户提升业务效率。

文字识别服务软件开发工具包(OCR SDK,Optical Character Recognition Service Software Development Kit)是对OCR服务提供的REST API进行的封装,以简化用户的开发工作。用户直接调用OCR SDK提供的接口函数即可实现使用OCR服务业务能力的目的。

我们针对不同语言的SDK提供了开发指南:

表1 不同语言SDK的开发指南

编程语言

开发指南

Java

Java SDK 开发指南

Python

Python SDK 开发指南

Node.js

Node.js SDK 开发指南

PHP

PHP SDK 开发指南

C++

C++ SDK 开发指南

Go

Go SDK 开发指南

NET

NET SDK 开发指南

SDK代码示例自动生成

API Explorer提供API检索及平台调试,支持全量快速检索、可视化调试、帮助文档查看、在线咨询。

您只需要在API Explorer中修改接口参数,即可自动生成对应的代码示例。同时,可在集成开发环境CloudIDE中完成代码的构建、调试、运行等操作。

图1 API Explorer

与API的对应关系

文字识别接口与API对应关系请参见表2

表2 接口与API对应关系表

接口

API

通用证件识别

POST /v2/{project_id}/ocr/id-document

通用表格识别

POST /v2/{project_id}/ocr/general-table

通用文字识别

POST /v2/{project_id}/ocr/general-text

网络图片识别

POST /v2/{project_id}/ocr/web-image

护照识别

POST /v2/{project_id}/ocr/passport

泰文身份证识别

POST /v2/{project_id}/ocr/thailand-id-card

柬文身份证识别

POST /v2/{project_id}/ocr/cambodian-idcard

缅文身份证识别

POST /v2/{project_id}/myanmar-id-card

缅文驾驶证识别

POST /v2/{project_id}/ocr/myanmar-driver-license

智利身份证识别

POST /v2/{project_id}/ocr/chile-id-card

越南身份证识别

POST /v2/{project_id}/ocr/vietnam-id-card

泰国车牌识别

POST /v2/{project_id}/ocr/thailand-license-plate