发表于：2023-10-30 19:08:280次点击

在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?[阿里云OCR]

在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的，方便说一下，这个坐标要如何变换，能反应到原图上呢？使用的是机动车注册登记证识别接口，现在返回的坐标疑似是进行过图片矫正后的坐标。api文档写的确实是原图中的坐标，但是实际上不是，用坐标在原图中找的位置都有偏移，使用子图的话，有些图大概能对上，但是有些图对不上，从框出的位置来看，怀疑是对子图又进行过矫正。

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

2 条回复 A 作者 M 管理员

小小杳杳杳AM 2023-11-28 3:37:16 1

是在原图中的坐标。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

已喜欢已反对
小周sirAM 2023-11-28 3:37:16 2
一般来说，OCR 服务可能会对输入图片进行校正或裁剪等预处理操作，因此返回坐标可能存在偏差。
如果您想将坐标恢复到原始图像的位置，请参考以下步骤：

使用 OCR 服务的原图，还原预处理操作。这包括旋转、缩放、裁剪等；

对于矫正后的坐标，将其变换到原始图像的空间中。可以使用透视变换、仿射变换或相似变换等方式来完成；

在变换过程中，确保保持尺寸的比例和坐标系的统一；

最后，确保数据的一致性和准确性。
已喜欢已反对
sun20AM 2023-11-28 3:37:16 3
在OCR识别中，ValuePos表示的是识别结果在原始图像中的位置。如果ValuePos的坐标不是在原图上的，那么可能是以下几种情况：

图像预处理：在进行OCR识别之前，可能对图像进行了预处理，例如旋转、缩放、裁剪等，这可能导致原图的坐标系发生变化。

图像分割：如果图像被分割成多个子图进行识别，那么每个子图的坐标系可能与原图不同。

图像矫正：如果图像存在倾斜、旋转等问题，可能需要先进行图像矫正，这也可能导致坐标系发生变化。

对于这种情况，你可以尝试以下方法：

获取原始图像：如果可以的话，尽量获取原始图像，然后根据原始图像的坐标系进行调整。

图像配准：如果有多个子图，可以尝试进行图像配准，使得所有子图的坐标系一致。

坐标变换：如果已知坐标变换关系，可以进行坐标变换，将坐标转换到原图坐标系。

使用机器学习：如果可能的话，可以使用机器学习的方法，通过学习大量的样本，自动纠正坐标偏移。
已喜欢已反对

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?[阿里云OCR] 暂停朗读为您朗读

在文字识别ocr中，ocr接口返回的数据中valuePos 对应的坐标不是在原图上的是为什么?[阿里云OCR]