本地调用
本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。
该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。
前提条件
- 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。
- 已开通通用表格识别。
操作步骤
- 获取并安装OCR Python SDK。
在PyCharm中新建一个项目,并单击左下方“Terminal”按钮。分别执行以下命令安装SDK(该SDK支持Python3及以上版本)。
# 安装核心库 pip install huaweicloudsdkcore # 安装OCR服务库 pip install huaweicloudsdkocr
- 检查SDK是否已正确安装。
- 获取通用表格识别SDK示例代码。
- 登录API Explorer,在“代码示例”中选择“Python”。
- 填写请求Body参数。输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0282767866.png。
- 复制代码示例至PyCharm中。
- 登录API Explorer,在“代码示例”中选择“Python”。
- 获取AK/SK,替换代码示例中的“<YOUR AK>”、“<YOUR SK>”参数。
登录访问密钥页面,新增访问密钥,或使用已有的访问密钥。访问密钥为credentials.csv文件,包含AK/SK信息。
- 运行代码示例,获取识别结果。