文字识别OCR还有空格怎么也保留呢?[阿里云OCR]

文字识别OCR还有空格怎么也保留呢?标注的时候空格是有的,但是模型训练完之后体验的时候就都没有空格了

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
3 条回复 A 作者 M 管理员
  1. 您好,您可以尝试一下文字识别OCR文档自学习的自定义表格模板,通过一张模板数据的可视化拖拉拽配置参照字段、识别字段或表头&待识别的列表区域,字段属性等,无需进行数据标注和模型训练,即可实现相同版式数据的自定义结构化识别抽取。

    具体的操作步骤可以参考文档:文档

  2. 楼主你好,阿里云文字识别OCR的识别结果可能会去掉空格。如果您需要保留空格,可以尝试在识别结果中添加空格并重新训练模型。另外,您可以尝试在OCR识别之前使用文本清洗技术,例如移除多余空格或添加缺失空格,以帮助提高OCR的准确性和空格的保留。

  3. 要保留文字识别OCR中的空格,您可以尝试以下方法:

    1. 调整OCR参数:某些OCR服务提供商可能具有用于调整识别结果的参数设置。您可以查看相关文档或API参考,了解是否有与空格相关的参数选项。尝试更改参数设置以确保空格被正确识别和保留。

    2. 使用特殊字符处理:有些OCR服务会将空格识别为普通字符,而不是保留其作为空格。在处理识别结果时,您可以使用特殊字符处理功能来替换这些字符为实际的空格。例如,您可以将特殊字符替换为Unicode编码中的空格字符(U+0020)。

    3. 后处理和规则定义:在进行OCR后,您可以应用后处理步骤来处理识别结果并保留空格。这可以通过使用正则表达式或其他字符串处理技术来实现。您可以编写适当的规则和逻辑来检测和保留空格。

    4. 自定义模型训练:对于一些OCR服务,您可能有机会使用自定义模型进行训练。通过提供包含空格样本的训练数据,您可以训练OCR模型以更好地识别和保留空格。这需要更多的工作和资源,但可以提高空格保留的准确性。

  4. 这个用表格模型就可以解决。此回答整理自钉群“【官方】阿里云OCR文档自学习用户答疑群”