文档首页/ 文字识别 OCR/ 常见问题/ 产品咨询类/ OCR服务可以识别文本格式文件吗
更新时间:2025-10-23 GMT+08:00

OCR服务可以识别文本格式文件吗

华为云 OCR 服务的核心功能是对图像中的文字进行检测与提取,其识别对象限定为静态图像数据,无法直接读取并识别 word、pdf、excel 等文本格式文件。这类文本格式文件本质上是结构化的文档文件,与 OCR 服务所适配的 “图像载体” 存在差异。

若用户需要识别 word、pdf、excel 等文件中的文字,需先完成 “文件转图像” 的预处理操作。将文本格式文件中的每一页内容转化为清晰的静态图像。待文件转换为符合要求的图片格式后,再按照华为云 OCR 服务的常规使用流程,通过调用 API 或 SDK 传入图片数据,即可完成文字识别。