文字识别ocr中我们的需求是要识别 pdf 中的内容,包含文本,图片以及图片格式的表格哪个合适呢?[阿里云OCR]

文字识别ocr中我们的需求是要识别 pdf 中的内容,包含文本,图片以及图片格式的表格,图片可能是横向的。哪个接口更合适呢?类似与这样的 pdf 文件。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
1 条回复 A 作者 M 管理员
  1. 文字识别 OCR 提供几种不同的识别方案,包括文本识别、图片识别和表格识别。
    对于 PDF 文件中的内容,可以根据不同的需求选用相应的 OCR 方案,一般情况下可以采用以下方法:

    1. 文本识别:适用于 PDF 文件中的文本。
    2. 图片识别:适用于 PDF 文件中的图片内容。
    3. 表格识别:适用于 PDF 文件中的表格。

    此外,文字识别 OCR 可以智能识别 PDF 文件中的表格内容,并返回表格结构信息。
    最后,在使用文字识别 OCR 解决 PDF 文件的文本、图片和表格时,应根据实际需要选取相应的方案。

  2. 楼主你好,看了你的问题,阿里云OCR中的pdf表格识别pdf文档识别接口可能更适合你。

    pdf表格识别接口可以识别 PDF 中的表格,支持表格中包含文字和图片。

    pdf文档识别接口可以识别 PDF 中的文字和图片,包括横向的图片。

    这里,你可以根据实际情况选择使用相应的接口。