文字识别OCR如何使用ocr服务返回的Json，生成带格式的文本？[阿里云OCR]

文字识别OCR如何使用ocr服务返回的Json，生成带格式的文本？

「点点赞赏，手留余香」

还没有人赞赏，快来当第一个赞赏的人吧！

=====这是一个广告位，招租中，联系qq 78315851====

5 条回复 A 作者 M 管理员

三掌柜666AM 2023-11-28 3:20:05 1
楼主你好，阿里云文字识别OCR返回的是一段JSON数据，要生成带格式的文本需要对JSON数据进行解析。以下是Python示例代码，假设OCR服务返回的JSON数据保存在变量result中：

import json# 解析JSON数据data = json.loads(result)# 获取文本块列表blocks = data["prism_wordsInfo"]# 根据每个文本块的位置信息，将文本块按照从上到下、从左到右的顺序排序blocks.sort(key=lambda x: (x["location"]["top"], x["location"]["left"]))# 生成带格式的文本text = ""for block in blocks: text += block["word"] + " " if block["location"]["width"] + block["location"]["left"] >= 1: text += ""print(text)

该代码将OCR服务返回的JSON数据解析成文本块列表，然后按照从上到下、从左到右的顺序排序，并逐个输出每个文本块的内容，其中根据每个文本块的位置信息判断是否需要换行。这样就可以生成带格式的文本了。
已喜欢已反对
六月的雨在钉钉AM 2023-11-28 3:20:05 2

您好，文字识别OCR您在调用具体业务场景下API接口返回Json数据后，您可以对接口返回的Json数据自行进行格式文本的匹配，根据您的具体需求将OCR接口返回的Json数据转化成您需要的格式。

已喜欢已反对
ÐAM 2023-11-28 3:20:05 3

二次开发-此回答整理自钉群“【官方】阿里云OCR公共云客户交流群”

已喜欢已反对
小周sirAM 2023-11-28 3:20:05 4
使用OCR服务返回的JSON数据生成带格式的文本有多种方法，具体取决于你想要的输出格式和目标。

以下是一些常见的方法：

提取字段并拼接文本：分析OCR返回的JSON数据结构，并提取其中的字段，如文字内容、坐标信息等。然后，根据需要，将这些字段按照所需的格式进行拼接，生成带有格式的文本。例如，可以将识别的文字按行或段落排列，并添加相应的换行符、缩进、标点符号等来保持文本的格式。

使用模板引擎：如果你有特定的输出格式需求，可以考虑使用模板引擎来生成带格式的文本。模板引擎可以根据预定义的模板规则，将OCR返回的JSON数据中的字段值插入到相应的位置上，以生成所需的格式化文本。

借助样式化语言：如果你需要更复杂的格式化效果，如字体样式、颜色、布局等，你可以使用样式化语言（如HTML、Markdown等）来处理OCR返回的JSON数据。将OCR识别的文字嵌入到相应的样式标签或语法中，以实现所需的格式化效果。

无论选择哪种方法，都需要仔细分析OCR返回的JSON数据结构，并根据具体需求进行处理和转换。确保理解OCR返回的字段含义，并灵活运用相关技术和工具，以生成符合预期格式的文本输出。
已喜欢已反对
Star时光AM 2023-11-28 3:20:05 5
使用OCR服务返回的JSON数据生成带格式的文本通常需要进行一些处理和解析操作。以下是一般的步骤：

解析JSON：首先，你需要解析OCR服务返回的JSON数据，以获取识别结果中的文本信息和其相应的坐标位置。不同的OCR服务可能会返回不同的JSON结构，因此你需要根据具体的服务提供商的文档来了解其返回的JSON格式。

提取文本和坐标：从解析后的JSON数据中提取出所需的文本信息和其对应的坐标位置。文本信息通常包含在JSON中的特定字段中，而坐标位置则可以用于确定每个文本区域的边界。

格式化文本：根据坐标位置，将提取出的文本信息放置到相应的位置上，以还原原始图像中的文本布局和格式。这可能涉及到文本的行、段落、字体样式（如粗体、斜体）、间距等方面的处理。

导出为带格式的文本：将处理后的文本信息根据需要导出为带格式的文本文件，如HTML、Markdown或其他格式。你可以根据具体需求来决定输出的文本格式，并使用相应的工具或库来实现导出操作。
已喜欢已反对

2025 年 3 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

文字识别OCR如何使用ocr服务返回的Json，生成带格式的文本？[阿里云OCR] 暂停朗读为您朗读

文字识别OCR如何使用ocr服务返回的Json，生成带格式的文本？[阿里云OCR]