tongchenkeji 发表于:2023-6-27 15:44:450次点击 已关注取消关注 关注 私信 在OCR用户上传pdf文件,我想提取出pdf页面的数据,是不是自己要先把页面转成图片,才能调用阿?[阿里云OCR] 暂停朗读为您朗读 在OCR用户上传pdf文件,我想提取出pdf页面的数据,是不是自己要先把页面转成图片,才能调用你们的api啊?能直接传文件识别吗? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 印刷文字识别# API1163# 文字识别1940# 视觉智能开放平台3859
Star时光AM 2023-11-28 3:19:17 1 OCR 技术可以直接处理 PDF 文件,并不一定需要将其转换成图片格式。在进行 OCR 处理时,OCR 服务提供商一般会将 PDF 文件转换为可编辑的文本格式,然后在内部进行识别和提取。 具体来说,在使用 OCR 技术提取 PDF 页面数据时,可以采用以下两种方式: 直接上传 PDF 文件:将 PDF 文件上传到 OCR 服务提供商的云端服务器,利用其提供的 API 接口或 SDK,对文件中的文本内容进行 OCR 识别、转换和输出。这种方式可以直接从 PDF 中提取数据,避免了额外的图像转换过程,并且可以保留原始数据的排版和格式信息。 手动转换为图片格式:如果您希望先将 PDF 文件转换为图片格式再进行 OCR 处理,也可以采用这种方式。在将 PDF 文件转换为图片格式后,调用 OCR SDK 或 API 接口,对图像进行 OCR 识别和提取。但是需要注意的是,这种方法可能会使得处理时间更长,并且需要额外的存储空间来保存图像文件。 总之,在选择 OCR 技术进行 PDF 数据提取时,可以根据实际需求和数据来源,结合 OCR 服务商的功能特点和优势,选择最适合自己的解决方案。
牧羊吖AM 2023-11-28 3:19:17 2 OCR 的文字识别 API 通常可以直接接收 PDF 文件进行识别,不需要先手动将其转换为图片格式。一般情况下,OCR API 都支持直接上传 PDF 文件进行识别,而且可以同时识别多个页面,以及返回每个页面的结果。
TiAmoZhangAM 2023-11-28 3:19:17 4 是的,您需要先将PDF文件转换为图片格式,然后再调用OCR API进行识别。您可以使用一些开源工具(如pdftoppm、Ghostscript等)将PDF文件转换为图片。以下是一个使用pdftoppm将PDF文件转换为图片的示例: pdftoppm -jpeg input.pdf output_page%d.jpeg 这将把名为input.pdf的文件转换为一系列名为output_page0.jpeg、output_page1.jpeg等的图片。然后,您可以将这些图片作为输入传递给OCR API进行识别。
OCR 技术可以直接处理 PDF 文件,并不一定需要将其转换成图片格式。在进行 OCR 处理时,OCR 服务提供商一般会将 PDF 文件转换为可编辑的文本格式,然后在内部进行识别和提取。
具体来说,在使用 OCR 技术提取 PDF 页面数据时,可以采用以下两种方式:
直接上传 PDF 文件:将 PDF 文件上传到 OCR 服务提供商的云端服务器,利用其提供的 API 接口或 SDK,对文件中的文本内容进行 OCR 识别、转换和输出。这种方式可以直接从 PDF 中提取数据,避免了额外的图像转换过程,并且可以保留原始数据的排版和格式信息。
手动转换为图片格式:如果您希望先将 PDF 文件转换为图片格式再进行 OCR 处理,也可以采用这种方式。在将 PDF 文件转换为图片格式后,调用 OCR SDK 或 API 接口,对图像进行 OCR 识别和提取。但是需要注意的是,这种方法可能会使得处理时间更长,并且需要额外的存储空间来保存图像文件。
总之,在选择 OCR 技术进行 PDF 数据提取时,可以根据实际需求和数据来源,结合 OCR 服务商的功能特点和优势,选择最适合自己的解决方案。
OCR 的文字识别 API 通常可以直接接收 PDF 文件进行识别,不需要先手动将其转换为图片格式。一般情况下,OCR API 都支持直接上传 PDF 文件进行识别,而且可以同时识别多个页面,以及返回每个页面的结果。
支持PDF和图片。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”
是的,您需要先将PDF文件转换为图片格式,然后再调用OCR API进行识别。您可以使用一些开源工具(如pdftoppm、Ghostscript等)将PDF文件转换为图片。以下是一个使用pdftoppm将PDF文件转换为图片的示例:
这将把名为
input.pdf
的文件转换为一系列名为output_page0.jpeg
、output_page1.jpeg
等的图片。然后,您可以将这些图片作为输入传递给OCR API进行识别。