更新时间:2024-03-14 GMT+08:00
分享

本地调用

本章节以通用表格识别为例,介绍如何使用OCR Python SDK在本地进行开发。

该接口可以识别表格图片中的文字内容,并将识别结果以JSON格式返回给用户。返回结果包含两类:纯文本区(text)和表格区(table),并返回表格结构(row, column)和文本信息。

前提条件

  • 注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费、冻结、被注销等异常状态。
  • 开通通用表格识别

操作步骤

  1. 获取并安装OCR Python SDK。

    以PyCharm为例,介绍如何安装SDK。

    在PyCharm中新建一个项目,并单击左下方“Terminal”按钮。分别执行以下命令安装SDK(该SDK支持Python3及以上版本)。
    # 安装核心库
    pip install huaweicloudsdkcore
    # 安装OCR服务库
    pip install huaweicloudsdkocr

  2. 检查SDK是否已正确安装。

    在PyCharm中选择File > Settings > Project > Python Interpreter,检查SDK是否已正确安装。

  3. 获取通用表格识别SDK示例代码。
    1. 登录API Explorer,在“代码示例”中选择“Python”

    2. 填写请求Body参数。输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0282767866.png。

    3. 复制代码示例至PyCharm中。
  4. 获取AK/SK,替换代码示例中的“<YOUR AK>”“<YOUR SK>”参数。

    登录访问秘钥页面,新增访问秘钥,或使用已有的访问秘钥。访问秘钥为credentials.csv文件,包含AK/SK信息。

  5. 运行代码示例,获取识别结果。

分享:

    相关文档

    相关产品