文字识别OCR混贴发票识别中(一图多发票)怎么知道这个坐标哪个是图片需要截取的起始坐标？[阿里云OCR]

文字识别OCR混贴发票识别中(一图多发票)怎么知道这个坐标哪个是图片需要截取的起始坐标？同时这个所谓的从原图上截取，这个原图是指我混贴照片吗？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

4 条回复 A 作者 M 管理员

六月的雨在钉钉AM 2023-11-28 3:22:47 1

您好，文字识别OCR识别具体图片内容信息时会返回图片中内容的坐标信息，比如发票日期的坐标信息

具体的value值即是图片中对应坐标位置的文本内容。原图是您上传的图片

已喜欢已反对
挚爱长虹AM 2023-11-28 3:22:47 2

是的原图就是你上传的图片。此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”。

已喜欢已反对
魏红斌AM 2023-11-28 3:22:47 3

文字块的外矩形四个点的坐标按顺时针排列（左上、右上、右下、左下）。当NeedRotate=true时，如果最外层的angle不为0，需要按照angle矫正图片后，坐标才准确。
阿里云表格识别，是阿里云官方自研OCR文字识别产品，支持对多种表格格式（有线表格、条纹表格、无线表格）进行智能文字识别并结构化输出识别结果。
阿里云OCR产品基于阿里巴巴达摩院强大的AI技术及海量数据，历经多年沉淀打磨，具有服务稳定、操作简易、实时性高、能力全面等几大优势。

已喜欢已反对
wljslmzAM 2023-11-28 3:22:47 4
在阿里云文字识别OCR的混贴发票识别中，根据返回的sliceRect参数来截取子图，确实需要知道截取的起始坐标。

对于混贴发票识别，sliceRect返回的四个坐标点表示子图在原图中的位置。这四个坐标点形成了一个矩形区域，其中两个对角点坐标 (x0, y0), (x2, y2) 不限制顺序，但需要保持相对位置的一致性。

为了知道哪个坐标是截取的起始坐标，您可以参考以下方法：

具体定义：根据阿里云的API文档和说明，可以查看对sliceRect的具体定义和描述，以确定哪个坐标点是矩形区域的起始坐标。

矩形区域大小：通过观察和比较四个坐标点的位置和数值，可以推断出哪两个坐标点形成了起始坐标和终止坐标。通常来说，起始坐标的数值较小，而终止坐标的数值较大。

关于原图的问题，混贴发票识别中的原图是指您上传或传入的混贴发票图像。您可以使用混贴发票识别的API将整张混贴发票图像作为输入，并根据返回的sliceRect参数来截取每个子图进行进一步的识别和处理。
已喜欢已反对
三掌柜666AM 2023-11-28 3:22:47 5

楼主你好，在进行阿里云文字识别OCR混贴发票识别中的一图多发票识别时，需要先确定图片需要截取的起始坐标。这个起始坐标可以通过手动观察原始图片来确定，也可以通过代码自动计算得出。

在进行从原图上截取时，原图指的是混贴照片中包含多张发票的图片。这些发票可能具有不同的大小和位置，因此需要先找到每张发票的位置信息，然后从原图上截取出每张发票的图像，再进行识别。

已喜欢已反对

2025 年 2 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

文字识别OCR混贴发票识别中(一图多发票)怎么知道这个坐标哪个是图片需要截取的起始坐标？[阿里云OCR] 暂停朗读为您朗读

文字识别OCR混贴发票识别中(一图多发票)怎么知道这个坐标哪个是图片需要截取的起始坐标？[阿里云OCR]