你好，我调用视频OCR功能，同一个视频，识别文本，有的可以识别，有的识别出来是空的，这是为啥？[视觉智能开放平台]

你好，我调用视频OCR功能，同一个视频，识别文本，有的可以识别，有的识别出来是空的，这是为啥？

阿里云视觉智能开放平台的视频 OCR 功能是基于深度学习技术和实时音视频流的文字识别服务，可以识别不同场景中的文字。但是，有时候在同一个视频中，出现识别结果不一致的情况，可能是以下原因造成的：

1.视频的清晰度和分辨率：如果视频的清晰度和分辨率不够高，那么在某些场景下，一些文本可能会因为过于模糊或者过小而无法被识别出来。

2.光照和背景：对于视频中出现的文本，光照和背景是非常重要的因素。如果文字出现在暗处或者过于复杂的背景中，OCR可能无法准确识别。

3.视频受损：如果视频中出现了损坏或丢失帧的情况，可能会导致一些文本的识别受到影响。

4.视频中存在干扰：一些噪声或干扰，如图像质量、视角、背景音乐或每帧的不同下的干扰可能会导致文本识别的不稳定。

1 条回复 A 作者 M 管理员

wljslmzAM 2023-11-28 7:47:13 1

阿里云视觉智能开放平台的视频 OCR 功能是基于深度学习技术和实时音视频流的文字识别服务，可以识别不同场景中的文字。但是，有时候在同一个视频中，出现识别结果不一致的情况，可能是以下原因造成的：

1.视频的清晰度和分辨率：如果视频的清晰度和分辨率不够高，那么在某些场景下，一些文本可能会因为过于模糊或者过小而无法被识别出来。

2.光照和背景：对于视频中出现的文本，光照和背景是非常重要的因素。如果文字出现在暗处或者过于复杂的背景中，OCR可能无法准确识别。

3.视频受损：如果视频中出现了损坏或丢失帧的情况，可能会导致一些文本的识别受到影响。

4.视频中存在干扰：一些噪声或干扰，如图像质量、视角、背景音乐或每帧的不同下的干扰可能会导致文本识别的不稳定。

已喜欢已反对
夏夜许游AM 2023-11-28 7:47:13 2

这个要找平台的技术同学看下，可能是算法效果问题，也可能是视频的问题。通过钉钉搜索群号23109592，加入阿里云视觉智能开放平台咨询群，与平台取得联系。

已喜欢已反对

你好，我调用视频OCR功能，同一个视频，识别文本，有的可以识别，有的识别出来是空的，这是为啥？[视觉智能开放平台] 暂停朗读为您朗读