在文字识别ocr中,ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?[阿里云OCR]

在文字识别ocr中,ocr接口返回的数据中valuePos 对应的坐标不是在原图上的,方便说一下,这个坐标要如何变换,能反应到原图上呢?使用的是 机动车注册登记证识别 接口,现在返回的坐标疑似是进行过图片矫正后的坐标。api文档写的确实是原图中的坐标,但是实际上不是,用坐标在原图中找的位置都有偏移,使用子图的话,有些图大概能对上,但是有些图对不上,从框出的位置来看,怀疑是对子图又进行过矫正。

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
2 条回复 A 作者 M 管理员
  1. 是在原图中的坐标。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

  2. 一般来说,OCR 服务可能会对输入图片进行校正或裁剪等预处理操作,因此返回坐标可能存在偏差。
    如果您想将坐标恢复到原始图像的位置,请参考以下步骤:

    1. 使用 OCR 服务的原图,还原预处理操作。这包括旋转、缩放、裁剪等;
    2. 对于矫正后的坐标,将其变换到原始图像的空间中。可以使用透视变换、仿射变换或相似变换等方式来完成;
    3. 在变换过程中,确保保持尺寸的比例和坐标系的统一;
    4. 最后,确保数据的一致性和准确性。
  3. 在OCR识别中,ValuePos表示的是识别结果在原始图像中的位置。如果ValuePos的坐标不是在原图上的,那么可能是以下几种情况:

    1. 图像预处理:在进行OCR识别之前,可能对图像进行了预处理,例如旋转、缩放、裁剪等,这可能导致原图的坐标系发生变化。

    2. 图像分割:如果图像被分割成多个子图进行识别,那么每个子图的坐标系可能与原图不同。

    3. 图像矫正:如果图像存在倾斜、旋转等问题,可能需要先进行图像矫正,这也可能导致坐标系发生变化。

    对于这种情况,你可以尝试以下方法:

    1. 获取原始图像:如果可以的话,尽量获取原始图像,然后根据原始图像的坐标系进行调整。

    2. 图像配准:如果有多个子图,可以尝试进行图像配准,使得所有子图的坐标系一致。

    3. 坐标变换:如果已知坐标变换关系,可以进行坐标变换,将坐标转换到原图坐标系。

    4. 使用机器学习:如果可能的话,可以使用机器学习的方法,通过学习大量的样本,自动纠正坐标偏移。