文字识别OCR文档自学习里的自定义KV模板只能上传一张样板图,那一些旋转的图片是怎么识别?[阿里云OCR]

文字识别OCR文档自学习里的自定义KV模板只能上传一张样板图,那一些旋转的图片是怎么识别?

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
3 条回复 A 作者 M 管理员
  1. 楼主你好,阿里云文字识别OCR文档自学习里的自定义KV模板可以通过训练来识别旋转的图片。具体来说,可以采用以下两种方法:

    1. 通过训练样本来识别旋转的图片。在训练时,可以将不同角度的图片作为训练样本,让模型自动学习如何识别旋转的图片。

    2. 在上传样板图时,可以选择将样板图进行旋转,使其包含不同角度的信息。这样,模型就能够学习到不同角度下的特征,从而提高识别准确率。

    需要注意的是,如果旋转的角度过大或出现了扭曲等情况,可能会对识别准确率造成影响。因此,在训练时需要尽可能考虑各种情况,以获得更好的效果。

  2. 您好,文字识别OCR文档自学习的自定义KV模版需上传字迹清晰且无旋转的模板图片

    然后框选参照字段,配置识别字段,最后测试和发布后即可在线调用,目前应是不支持旋转图片,建议参照官方文档上传符合条件的模版图片。

  3. 对于文字识别OCR的文档自学习功能中的自定义KV模板,目前只支持上传一张样本图片进行标注。这意味着如果你的图片包含旋转的文本,可能无法直接使用自定义KV模板来正确识别旋转的文本。

    在处理旋转的图片时,你可以尝试以下方案:

    1. 预处理图像:在使用自定义KV模板之前,先对旋转的图片进行预处理。使用图像处理库(如PIL、OpenCV等)可以进行图像旋转操作,将旋转的文本调整为水平或垂直方向。这样,你就能够使用自定义KV模板来正确识别文本。

    2. 使用通用OCR功能:如果旋转的文本较多或难以预测,并且自定义KV模板无法应对,你可以考虑使用文字识别OCR的通用OCR功能。通用OCR功能对于不同角度和旋转程度的文本具有更好的适应性和鲁棒性,在某些情况下可以正确识别旋转的文本。

  4. 我们是有内置自动旋转能力的,在配置的时候勾选即可。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”