在文字识别ocr中，纸质表格识别后能返回给出一个字典形式能明确知道它对应的key与value值吗？[阿里云OCR]

在文字识别ocr中，纸质表格识别后，能返回给出一个字典形式，能明确知道它对应的key与value值吗？我们的同事试过了，识别不了，而且识别时和我设置的识别区不一致？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

2 条回复 A 作者 M 管理员

sun20AM 2023-11-28 3:24:00 1
阿里云的表格识别API “RecognizeTableOcr – 表格识别”返回的结果是一个JSON对象，其中包含了识别到的表格数据。这个JSON对象的每一行代表表格的一行，每一列代表表格的一列，每个单元格的值对应于JSON对象中的一个键值对。

例如，如果识别到的表格如下：

姓名年龄张三 28李四 35

那么，API返回的JSON对象可能会如下所示：

{ "姓名": "张三", "年龄": "28"}

在这个例子中，"姓名"和"年龄"分别是JSON对象中的两个键，而"张三"和"28"分别是它们对应的两个值。

如果你的同事发现识别结果和他设置的识别区不一致，可能是因为他在设置识别区时出现了错误。他可能需要检查他的代码，确保他正确设置了识别区的范围和大小。

至于你提到的"识别不了"的问题，可能是因为你的图片质量不高，或者图片中的表格格式复杂，这都可能导致OCR识别失败。你可以尝试提高图片的分辨率，或者简化表格的格式，看看是否能改善识别的效果。
已喜欢已反对
Star时光AM 2023-11-28 3:24:00 2
在文字识别 OCR 中，对于纸质表格的识别，根据阿里云的文档，返回的结果通常是一个结构化的表格数据，以 JSON 格式表示。对于每个识别出的表格单元格，会提供相应的行号、列号和文本内容。

然而，由于文字识别是基于图像进行分析和处理的技术，其准确性可能受到多种因素的影响，如图像质量、表格布局复杂性等。因此，可能会出现以下情况：

识别不准确：由于图像质量、表格布局等原因，OCR 可能无法完全准确地识别所有表格单元格。这可能导致返回的结果与你预期的不一致。

识别区域不一致：如果你设置了特定的识别区域（ROI）用于识别表格，但返回的结果与你的设置不一致，可能是由于识别算法对图像进行了自适应处理，并尝试找到最佳的表格边界。

要处理这些问题，可以尝试以下方法：

改善图像质量：优化图像质量可以提高 OCR 的准确性。确保拍摄或扫描的图像清晰、亮度适当，并尽量避免图像模糊、倾斜或有阴影等问题。

调整识别区域：如果返回的结果与你的预期不一致，可以尝试调整识别区域的设置。根据表格的实际布局和边界，适当调整识别区域以获得更准确的结果。

后处理与校正：在获取到 OCR 的识别结果后，你可以对结果进行后处理和校正。例如，通过使用自然语言处理技术分析文本内容，并根据上下文来确定每个识别结果的具体含义。

使用其他算法或工具：如果阿里云 OCR 的识别结果不符合你的需求，你可以考虑尝试其他的 OCR 算法或工具。市场上有多种 OCR 引擎可供选择，你可以根据实际情况和需求进行评估。
已喜欢已反对
小小杳杳杳AM 2023-11-28 3:24:00 3

可以用自学习的表格模版。此回答来自钉群【官方】阿里云OCR公共云客户交流群。

已喜欢已反对

一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28

在文字识别ocr中，纸质表格识别后能返回给出一个字典形式能明确知道它对应的key与value值吗？[阿里云OCR] 暂停朗读为您朗读

在文字识别ocr中，纸质表格识别后能返回给出一个字典形式能明确知道它对应的key与value值吗？[阿里云OCR]