智能视频检索源自计算机视觉技术,计算机视觉技术是人工智能研究的分支之一,它能够在图像及图像内容描述之间建立映射关系,从而使计算机能够通过数字图像处理和分析来有限理解视频画面中的内容。视频检索能够实现哪五种功能呢?
1、目标检测是按一定时间间隔从视频图像中抽取像素,采用软件技术来分析数字化的像素,将运动物体从视频序列中分离出来。运动目标检测技术是智能化分析的基础。常用的目标检测技术可以分为背景减除法、时间差分法和光流法三类。
2、目标跟踪算法根据不同的分类标准,有着以下两种分类方法:根据目标跟踪与目标检测的时间关系分类和根据目标跟踪的策略分类。
3、目标识别利用物体颜色、速度、形状、尺寸等信息进行判别,区分人、交通工具和其他对象。目标识别常用人脸识别和车辆识别。
4、行为分析是指在目标检测、跟踪和识别的基础上,对其行为进行更高层次的语义分析。现有的行为分析技术根据分析的细节程度和对分析结果的判别要求可以分为三类:第一类使用了大量的细节,并往往使用已经建立好的数据进行分析而较少使用目标的时域信息。基于人脸、手势、步态的行为分析方法属于这一类;第二类是将目标作为一个整体,使用目标跟踪的算法来分析其运动轨迹以及该目标与其它目标的交互;第三类是在前两类的基础上做一个折中,它使用时域和空域的信息,分析目标各部分的运动。
5、图像检索基于内容的图像检索技术是由用户提交检索样本,系统根据样本对象的底层物理特征生成特征集,然后在视频库中进行相似性匹配,得到检索结果的过程。现有基于内容的检索方法主要分为:基于颜色的检索方法、基于形状的检索方法和基于纹理的检索方法等。数据融合是将来自不同视频源的数据进行整合,以获得更丰富的数据分析结果。