文字识别OCRpfd文件第一页中既有普通的文字，也有表格，需要把表格的内容识别出来要用那个API呢？[阿里云OCR]

文字识别OCRpfd文件第一页中既有普通的文字，也有表格，需要把表格的内容识别出来要用那个API呢？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

5 条回复 A 作者 M 管理员

wljslmzAM 2023-11-28 3:41:56 1
对于识别PFD文件中既有普通文字又有表格的情况，您可以使用阿里云文字识别OCR服务中的”表格文字识别”（Table Recognition）功能来识别表格内容。这需要使用阿里云OCR的”ocr_table_parse”接口。

以下是一般的步骤：

准备PDF文件：将包含表格的PDF文件上传至阿里云OCR服务。

调用OCR服务接口：使用”ocr_table_parse”接口调用OCR服务，并传入PDF文件路径或二进制文件数据。

解析表格内容：OCR服务会对PDF中的表格进行解析，并识别表格中的文字和结构。您可以通过解析返回的数据来获取表格的结构信息和文字内容。
已喜欢已反对
ÐAM 2023-11-28 3:41:56 2

有图片吗 -此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

已喜欢已反对
Star时光AM 2023-11-28 3:41:56 3
如果你的PDF文件的第一页既包含普通文本又包含表格，并且你希望将表格内容单独识别出来，你可以使用OCR服务的表格识别（Table Recognition）API。这个API专门用于识别和提取表格中的内容。

表格识别API通常具有以下特点：

识别表格结构：表格识别API能够检测并识别PDF中的表格结构，包括表格的行、列和单元格。

提取表格数据：通过表格识别API，你可以获取每个单元格中的文字或数字内容，并以结构化形式返回表格数据。

表格重构和格式化：一些表格识别API还可以对识别结果进行表格重构和格式化，使其更易于阅读和处理。

请注意，不同的OCR服务提供商可能会使用不同的名称和接口来实现表格识别。因此，在选择OCR服务时，建议查看所选服务提供商的相关文档，并找到适合你需求的表格识别功能。
已喜欢已反对
算精通AM 2023-11-28 3:41:56 4

如果您需要识别 PDF 文件中的表格内容，可以使用 OCR 文字识别服务提供的表格识别 API 接口。表格识别 API 接口通常可以将 PDF 文件中的表格内容提取出来，并转换成结构化数据，例如表格、Excel 文件等等。

一些 OCR 文字识别服务提供商，例如百度 OCR、阿里云 OCR、腾讯 OCR 等，都提供了表格识别 API 接口，可以方便地将 PDF 文件中的表格内容提取出来。具体使用方法和参数设置可以参考对应 OCR 文字识别服务提供商的 API 文档和示例代码。

已喜欢已反对
穿过生命散发芬芳AM 2023-11-28 3:41:56 5

RecognizeTableOcr – 表格识别

阿里云表格识别，是阿里云官方自研OCR文字识别产品，支持对多种表格格式（有线表格、条纹表格、无线表格）进行智能文字识别并结构化输出识别结果。

已喜欢已反对
魏红斌AM 2023-11-28 3:41:56 6

OCR可以直接输出Excel表格吗
您好，官网OCR文字识别，目前接口返回的数据都是以json格式进行出参，暂时并不能将数据直接返回为Excel表格。如需Excel导出可查看云市场印刷文字识别—表格提取与excel导出，可支持对有线表格、条纹表格进行识别，并支持导出Excel功能，用户可进行二次编辑。

已喜欢已反对

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

文字识别OCRpfd文件第一页中既有普通的文字，也有表格，需要把表格的内容识别出来要用那个API呢？[阿里云OCR] 暂停朗读为您朗读

文字识别OCRpfd文件第一页中既有普通的文字，也有表格，需要把表格的内容识别出来要用那个API呢？[阿里云OCR]