为什么使用文字识别OCR标注了后面的,前面的标注没有了?[阿里云OCR]

为什么使用OCR文档自学习标注了后面的,前面的标注没有了?现在显示检查中

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
=====这是一个广告位,招租中,联系qq 78315851====
7 条回复 A 作者 M 管理员
  1. 对于文字识别OCR标注,如果您之前对文本进行了标注,然后又对后面的文本进行了标注,可能会导致系统重新计算标注结果,覆盖之前的标注。您可以尝试在标注前,将整个文本区域一次性地进行标注,以避免重复标注和覆盖。

    对于OCR文档自学习标注,可能是因为您在标注完前面的文本后,对后面的文本进行了标注,并且进行了保存操作,导致系统重新计算标注结果,覆盖了之前的标注。此外,检查中的状态可能意味着系统正在重新计算标注结果,需要一些时间才能完成。

  2. 阿里云文字识别OCR服务提供的标注任务是基于云端数据的,如果在标注过程中数据发生了变化,可能会影响已经标注的数据。

    为了避免这种情况的发生,建议您在标注之前先备份一份数据,以便在出现数据丢失或者覆盖的情况下可以恢复之前的标注信息。同时,也可以在标注过程中定期保存标注信息,以免意外情况导致标注信息丢失。

  3. 使用文字识别(OCR)进行标注时,标注的结果通常是基于每个字符或文本块的位置信息。因此,如果在对文本进行 OCR 标注时,后面的标注覆盖了前面的标注,可能是由于以下原因:

    1. 叠加标注:OCR 标注工具在处理文本时,可能采用叠加方式进行标注。当标注的区域重叠时,新的标注会覆盖之前的标注。这种情况下,你可以尝试调整标注的顺序或分开标注的区域,以避免覆盖。

    2. 识别误差:OCR 在识别文本时可能存在一定的误差。如果 OCR 引擎错误地识别了文本,导致后续的标注出现偏移或错位,可能会覆盖前面的标注。在这种情况下,你可以检查和修正 OCR 的识别结果,或者使用更准确的 OCR 引擎来提高识别质量。

    3. 其他因素:还有其他因素可能导致前面的标注消失,例如标注工具的设置、编辑操作等。请确认在标注过程中没有意外的删除或清除操作,或者检查标注工具的设置是否影响了标注的可见性。

  4. 用的是单证票据信息抽取吗,你总共上传了多少数据,是标注了后面几份数据前面几份数据标注的内容消失了吗?是在标注过程中,标注了后面的页数,返回前面几页发现前面几页的标注内容没有存储?要不您刷新页面再看看?—此回答来自钉群“【官方】阿里云OCR文档自学习用户答疑群”

  5. 这可能是由于OCR文档自学习标注时出现了一些错误,导致后面的标注被覆盖了前面的标注。当您提交文档进行OCR识别时,阿里云会对文档进行检查和修正,以确保文档的质量和准确性。如果发现文档存在问题,阿里云会将其标记为“检查中”,并要求您对文档进行修改或提供更多信息以解决问题。

    建议您重新检查文档,并尝试使用OCR文档自学习标注工具再次标注文档。

  6. 可能是因为您在使用OCR文档自学习标注时,可能选择了“仅对当前页面进行标注”或“只标注当前页码”,这样标注的内容只会在当前页面或当前页码生效,不会影响其他页面或页码。
    为了保证标注的内容能够在整个文档中生效,建议您在进行标注时选择“全文标注”或“整页标注”,这样标注的内容会在整个文档中生效。如果您需要仅对某些特定的内容进行标注,可以使用“仅对当前页面进行标注”或“只标注当前页码”功能。
    另外,如果您在标注时使用了一些特殊的符号或标记,可能会导致标注内容在某些页面上消失。建议您在标注时尽量使用简单的符号和标记,以保证标注内容的稳定性和可读性。

  7. 你好,文字识别OCR文档自学习标注后的质检是需要人工质检的,不会自动完成。你需要点击列表后面的【质检】按钮对标注的内容进行人工质检。

  8. 使用OCR进行文档自学习标注时,后面的标注覆盖了前面的标注的原因可能是由于以下几个可能的情况:

    1. 模型误判:OCR模型在处理文档时可能会出现误判的情况。如果后面的标注被认为是更准确或更符合预期的结果,系统可能会将其应用并覆盖掉之前的标注。

    2. 标注冲突:如果多个标注器同时对同一文本进行标注,或者多次运行自学习标注任务,可能会导致标注冲突。在这种情况下,系统通常会选择最新的标注结果,并覆盖之前的标注。

    3. 标注设置问题:有些标注工具或平台可能设定了仅显示最新的标注结果,而隐藏之前的标注。这样做是为了避免混淆和减少干扰。你可以检查一下标注工具或平台的设置,确认是否启用了类似功能。

    为了避免意外的标注覆盖,建议在进行OCR文档自学习标注时采取以下措施:

    • 在开始自学习标注之前,备份原始文档或标注数据,以便需要时可以恢复到之前的状态。

    • 确保标注过程中只有一个标注器在进行操作,避免多个标注器之间的冲突。

    • 在自学习标注任务中,仔细审查标注结果。如果发现错误或不准确的标注,请及时更正或调整,避免覆盖之前的标注。