文字识别OCR中第一个是多行识别成一行了,第二个是长的发票后面的内容就跑第一个里了,怎么解决?[阿里云]

“文字识别OCR中第一个是多行识别成一行了,第二个是长的发票后面的内容就跑第一个里了,第三个是少识别了一行,怎么解决?


「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
1 条回复 A 作者 M 管理员
  1. 您好,针对您在使用文字识别OCR时遇到的问题,以下是一些建议和解决方法:

    1. 多行识别成一行:这可能是因为OCR技术在处理多行文本时可能出现的误判。为了解决这个问题,您可以尝试使用不同的OCR工具,或者调整输入的图片质量。另外,深度学习时代的文字识别有CRNN算法和attention算法等,它们都在行识别方面表现较好。

    2. 长的发票后面的内容跑到第一个里:这可能是因为OCR在识别过程中没有正确划分文本段落。您可以尝试调整图像的预处理步骤,如进行边缘检测、获取轮廓以及透视变换,以帮助系统更好地识别文本段落。

    3. 少识别了一行:这可能是由于OCR在识别过程中出现了遗漏。为了解决这个问题,您可以考虑重新扫描或调整图片质量。同时,确保发票或其他文档的文字清晰可见,避免因为模糊或其他因素导致的漏识别。

  2. 不保证完全还原。 有可能识别错误的。但不能保证完全还原 我这边反馈下,短时间优化不了 需要数据支持如果有的话 也可以提供下。此答案整理至钉群”【官方】阿里云OCR公共云客户交流群”。