深度学习与目标检测:工具、原理与算法
上QQ阅读APP看书,第一时间看更新

1.3.1 传统算法

在传统算法阶段,检测器完全依靠人工设计特征。人们使用了非常多的技巧,目的在于让检测器获取更强的表达能力,同时尽可能地降低对计算资源的消耗。其中,有几种检测器的出现对目标检测技术的发展产生了重要影响。

1.Viola Jones检测器

Viola Jones检测器是P.Viola和M.Jones针对人脸检测场景提出的。在同等的算法精度下,Viola Jones检测器比同时期的其他算法有几十到上百倍的速度提升。Viola Jones检测器采用最直接的滑动窗口方法,检测框遍历图像上所有的尺度和位置,查看检测框是否包含人脸目标。这种滑动窗口看似简单,却需要耗费非常多的计算时间。Viola Jones检测器的优势在于使用了积分图像、特征筛选、级联检测的策略,使得算法速度有了巨大的提升。该检测器使用Hear特征,通过积分图像的技巧,大幅减少了特征的重复计算。在特征选择上,Viola Jones检测器基于Adaboost方法,从大量特征中选出若干适合检测任务的特征。在检测过程中,Viola Jones检测器使用检测步骤级联的方式,更聚焦于目标的确认,避免在背景区域耗费过多的计算资源。

2.HOG检测器

HOG(Histogram of Oriented Gradients,梯度方向直方图)特征是一种重要的尺度不变特征,由N.Dalal和B.Triggs于2005年提出,核心思想是用规则的网格将图像划分成大小相同的子块,在每一个子块中计算梯度方向直方图。通过这种方式,可以大大消除尺度变化和光照的影响。在相当长的时间里,HOG都是处理检测问题的一种重要特征,尤其是在行人检测场景,HOG有着极为重要的应用。

3.DPM检测器

DPM(Deformable Part Model,可变形组件模型)是一种基于组件的检测算法,由P.Felzenszwalb于2008年提出,后来R.Girshick对其进行了多项重要改进。DPM在特征层面对经典的HOG特征进行了扩展,也使用了滑动窗口方法,基于SVM进行分类,其核心思想是将待检测目标拆分成一系列部件,把检测一个复杂目标的问题转换成检测多个简单部件的问题。例如,将检测汽车转换成分别检测窗子、车体和车轮这3个部件。虽然如今检测算法的性能已经远超DPM,但DPM采用的问题拆分思想对后续检测算法的发展起到了深远的影响,现在很多检测问题都基于这一思想设计解决方案。也正因如此,P.Felzenszwalb和R.Girshick在2010年获得了PASCAL VOC授予的终身成就奖。