调用SDK实现通用表格识别
文字识别服务软件开发工具包(OCR SDK)是对文字识别服务提供的REST API进行的封装,以简化用户的开发工作。
本章节以通用表格识别API为例,介绍如何使用OCR Python SDK。
使用OCR SDK的详细步骤如下所示:
准备工作
注册华为账号并开通华为云,并完成实名认证,账号不能处于欠费或冻结状态。
步骤1:开通服务
- 登录华为云文字识别服务管理控制台。
控制台左上角默认显示服务部署在“华北-北京四”区域,请您根据业务需要选择对应区域,各服务部署的区域具体请参见终端节点。
- 选择需要使用的API,进行开通。
如未开通服务,调用服务时会提示ModelArts.4204报错,请在调用服务前先进入控制台开通服务,并注意开通服务区域与调用服务的区域保持一致。
步骤3:获取示例代码
获取通用表格识别SDK示例代码。
- 登录API Explorer,在“代码示例”中选择“Python”。
- 填写请求Body参数。输入数据可选image或url,本示例使用url,例如https://support.huaweicloud.com/api-ocr/zh-cn_image_0282767866.png。
- 复制代码示例至PyCharm中。
步骤4:调用服务
- 获取AK/SK,替换代码示例中的“<YOUR AK>”、“<YOUR SK>”参数。
登录访问密钥页面,新增访问密钥,或使用已有的访问密钥。访问密钥为credentials.csv文件,包含AK/SK信息。
- 运行代码示例,获取识别结果。
- 如遇到提示“InsecureRequestWarning: Unverified HTTPS request is being made”的https请求的错误警告,可通过添加下列代码消除警告。
import urllibs Urllibs.disable_warnings()
- 如遇到SSL配置的问题,调用服务时会提示“Error:sslHandShakeException occurred”报错,可根据需要配置跳过SSL证书校验或配置服务器端CA证书,解决办法可参考“SDK参考>Python SDK>配置客户端连接参数>SSL配置(可选)”章节。