基于深度学习的行人检测算法研究开题报告

 2020-02-10 10:02
1.目的及意义(含国内外的研究现状分析)

1.1 研究目的及意义

随着科技的进步与发展,我们的生活方式也在慢慢的改变,很多以前需要耗费大量人力才能完成的任务,现在可以直接交给计算机去完成。计算机视觉就是这些技术中非常重要的一个研究热点与方向,计算机视觉涉及了图像处理、机器学习、模式识别等多个学科[1],它的最终目的是模拟人的视觉能力,可以完成各种识别任务,在计算机视觉这个大的研究领域下,又有一个备受学术界和工业界关注的子方向——行人检测。

行人检测就是计算机对于给定的图像和视频,判断出其中是否有行人,如果有还需要给出行人的具体位置。行人检测是行人跟踪,行为分析,步态分析,行人身份识别等研究的基础和前提,一个好的行人检测算法能够为后者提供有力的支持和保障。现实生活中,行人检测有广泛的应用场景。

早期的算法使用了图像处理,模式识别中的一些简单方法,准确率低。随着训练样本规模的增大,如INRIA数据库、Caltech数据库和TUD行人数据库等的产生,出现了精度越来越高的算法,另一方面,算法的运行速度也被不断提升。按照实现原理,我们可以将这些算法可以分为基于运动检测的算法和基于机器学习的算法两大类。

基于背景建模和机器学习的方法在特定条件下可能取得较好的行人检测效率或精确度,但还不能满足实际应用中的要求。自从2012年深度学习技术被应用到大规模图像分类以来,研究人员发现基于深度学习学到的特征具有很强层次表达能力和很好的鲁棒性,可以更好的解决一些视觉问题。因此,深度卷积神经网络被用于行人检测问题是顺理成章的事情。

1.2 国内外研究现状

随着深度学习这股浪潮的兴起,计算机视觉领域逐渐开始采用基于深度学习 的算法进行目标检测。2013年,Sermanet等人提出一种基于CNN的Over Feat 算法[2],该算法主要采用滑窗(Sliding Window)来对目标进行定位检测。2014 年, Gishick等人在CVPR上发表的论文中提出R-CNN (Regions. CNN)算法[3],首先,采用SS ( Selective Search) [4]从图像中提取2000个可能包含目标的区域,然后,将这些候选区域(Region ofInterest, Rol) 缩小到统一大小 ( 227x227 ), 并且输入CNN中进行特征提取,最后,将特征向量输入SVM分类器,得到该 候选区域的种类。2015 年,Gishick 等人在CVPR上发表的论文中提出Fast R-CNN算法[5],首先,采用SS从原始图像中提取2000个RoI,然后,对整幅图像 进行卷积计算,得到卷积特征图(ConvolutionFeature Map),最后,使用感兴趣 区域池化层(RoI Pooling Layer)从卷积特征图中提取各个候选框的特征向量,特征向量经过全连接层(FullyConectedLayer)后,进入分类层和边框回归层。分类层主要用于判定候选框内的目标种类,边框回归层主要用于判定目标在图像中的具体位置。2015年,Ren等人在NIPS上发表的论文中提出Faster R-CNN算法[6],该算法采用RPN (RegionProposal Network)替代SS来提取候选框,将全部任务都统一于深度学习框架,实现了端到端(End-to-End) 的目标检测,并且全部计算在GPU上执行,使得目标检测精度与计算速度都有了一定提升。

您需要先支付 5元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,微信号:bysjorg 、QQ号:3236353895;