在OCR用户上传pdf文件，我想提取出pdf页面的数据，是不是自己要先把页面转成图片，才能调用阿？[阿里云OCR]

在OCR用户上传pdf文件，我想提取出pdf页面的数据，是不是自己要先把页面转成图片，才能调用你们的api啊？能直接传文件识别吗？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

3 条回复 A 作者 M 管理员

Star时光AM 2023-11-28 3:19:17 1
OCR 技术可以直接处理 PDF 文件，并不一定需要将其转换成图片格式。在进行 OCR 处理时，OCR 服务提供商一般会将 PDF 文件转换为可编辑的文本格式，然后在内部进行识别和提取。

具体来说，在使用 OCR 技术提取 PDF 页面数据时，可以采用以下两种方式：

直接上传 PDF 文件：将 PDF 文件上传到 OCR 服务提供商的云端服务器，利用其提供的 API 接口或 SDK，对文件中的文本内容进行 OCR 识别、转换和输出。这种方式可以直接从 PDF 中提取数据，避免了额外的图像转换过程，并且可以保留原始数据的排版和格式信息。

手动转换为图片格式：如果您希望先将 PDF 文件转换为图片格式再进行 OCR 处理，也可以采用这种方式。在将 PDF 文件转换为图片格式后，调用 OCR SDK 或 API 接口，对图像进行 OCR 识别和提取。但是需要注意的是，这种方法可能会使得处理时间更长，并且需要额外的存储空间来保存图像文件。

总之，在选择 OCR 技术进行 PDF 数据提取时，可以根据实际需求和数据来源，结合 OCR 服务商的功能特点和优势，选择最适合自己的解决方案。
已喜欢已反对
牧羊吖AM 2023-11-28 3:19:17 2

OCR 的文字识别 API 通常可以直接接收 PDF 文件进行识别，不需要先手动将其转换为图片格式。一般情况下，OCR API 都支持直接上传 PDF 文件进行识别，而且可以同时识别多个页面，以及返回每个页面的结果。

已喜欢已反对
圆不溜秋的小猫猫AM 2023-11-28 3:19:17 3

支持PDF和图片。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”

已喜欢已反对
TiAmoZhangAM 2023-11-28 3:19:17 4
是的，您需要先将PDF文件转换为图片格式，然后再调用OCR API进行识别。您可以使用一些开源工具(如pdftoppm、Ghostscript等)将PDF文件转换为图片。以下是一个使用pdftoppm将PDF文件转换为图片的示例：

pdftoppm -jpeg input.pdf output_page%d.jpeg

这将把名为input.pdf的文件转换为一系列名为output_page0.jpeg、output_page1.jpeg等的图片。然后，您可以将这些图片作为输入传递给OCR API进行识别。
已喜欢已反对

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

在OCR用户上传pdf文件，我想提取出pdf页面的数据，是不是自己要先把页面转成图片，才能调用阿？[阿里云OCR] 暂停朗读为您朗读

在OCR用户上传pdf文件，我想提取出pdf页面的数据，是不是自己要先把页面转成图片，才能调用阿？[阿里云OCR]