tongchenkeji 发表于:2023-4-4 14:26:070次点击 已关注取消关注 关注 私信 你好,我调用视频OCR功能,同一个视频,识别文本,有的可以识别,有的识别出来是空的,这是为啥?[视觉智能开放平台] 暂停朗读为您朗读 你好,我调用视频OCR功能,同一个视频,识别文本,有的可以识别,有的识别出来是空的,这是为啥? 「点点赞赏,手留余香」 赞赏 还没有人赞赏,快来当第一个赞赏的人吧! 海报 视觉智能开放平台# 文字识别1940# 视觉智能开放平台3859
wljslmzAM 2023-11-28 7:47:13 1 阿里云视觉智能开放平台的视频 OCR 功能是基于深度学习技术和实时音视频流的文字识别服务,可以识别不同场景中的文字。但是,有时候在同一个视频中,出现识别结果不一致的情况,可能是以下原因造成的: 1.视频的清晰度和分辨率:如果视频的清晰度和分辨率不够高,那么在某些场景下,一些文本可能会因为过于模糊或者过小而无法被识别出来。 2.光照和背景:对于视频中出现的文本,光照和背景是非常重要的因素。如果文字出现在暗处或者过于复杂的背景中,OCR可能无法准确识别。 3.视频受损:如果视频中出现了损坏或丢失帧的情况,可能会导致一些文本的识别受到影响。 4.视频中存在干扰:一些噪声或干扰,如图像质量、视角、背景音乐或每帧的不同下的干扰可能会导致文本识别的不稳定。
夏夜许游AM 2023-11-28 7:47:13 2 这个要找平台的技术同学看下,可能是算法效果问题,也可能是视频的问题。通过钉钉搜索群号23109592,加入阿里云视觉智能开放平台咨询群,与平台取得联系。
阿里云视觉智能开放平台的视频 OCR 功能是基于深度学习技术和实时音视频流的文字识别服务,可以识别不同场景中的文字。但是,有时候在同一个视频中,出现识别结果不一致的情况,可能是以下原因造成的:
1.视频的清晰度和分辨率:如果视频的清晰度和分辨率不够高,那么在某些场景下,一些文本可能会因为过于模糊或者过小而无法被识别出来。
2.光照和背景:对于视频中出现的文本,光照和背景是非常重要的因素。如果文字出现在暗处或者过于复杂的背景中,OCR可能无法准确识别。
3.视频受损:如果视频中出现了损坏或丢失帧的情况,可能会导致一些文本的识别受到影响。
4.视频中存在干扰:一些噪声或干扰,如图像质量、视角、背景音乐或每帧的不同下的干扰可能会导致文本识别的不稳定。
这个要找平台的技术同学看下,可能是算法效果问题,也可能是视频的问题。通过钉钉搜索群号23109592,加入阿里云视觉智能开放平台咨询群,与平台取得联系。