基于卷积神经网络的物体检测与分类毕业论文

2020-02-17 21:07:12

摘要

在计算机视觉领域，目标检测可以说是一个非常重要的研究方向，随着它的逐渐发展改进，在如今也是非常火热的研究领域，数以万计的研究员都在朝着这个方向发力。在视频或图像中检测出特定的目标并加以标记是目标检测技术的最终任务，对于这种任务的需求，也是随着社会的迅速发展而产生的，国家越来越富强，人们对生活的质量也提出了更高的要求，为了省出更多的时间做高素质要求的工作，我们需要把更多的机械性工作交由机器来完成，因此机器学习才发展起来并在许多领域做出了不小的贡献，包括国防安全、资金维护、人机交互、模式识别等，正是由于取得良好的效果，国家人民对它的需求也越来越大，硬件方面的发展也保证了它会有光明的前景，所以研究目标检测可以说是具有非常重要的意义，深度学习的出现刚好适应了时代的发展，其中表现极好的卷积神经网络凭借自身结构设计上的优点，在目标检测的发展中画上了浓重的一笔。

本论文对目标检测算法这个课题进行了研究，主要的研究工作包括：（1）先介绍了目标检测算法的发展背景及发展现状，以及在本篇文章，研究它的意义所在。（2）分析了目标检测的一些基本理论知识，还有一些重要技术应用。（3）简单介绍了一下近些年来目标检测算法的一些关键成果的核心思想及实际效果对比。（4）重点研究Faster R-CNN算法的基本原理框架，分析其在性能上与以往算法的提升。（5）在PASCAL VOC2007数据集上，基于Faster R-CNN的算法，利用深度学习tensorflow的框架训练得到了比较理想的模型，能对用户输入图片处理得到比较精确的判别结果。

关键词：目标检测；深度学习；卷积神经网络；图像识别

Abstract

In the field of computer vision, target detection can be said to be a very important research direction. With its improvement, many researchers are working in this direction in today's very hot research field. Detecting and marking specific targets in video or images is the ultimate task of target detection technology. the demand for this task is also produced with the rapid development of society, and the country is becoming stronger. People also put forward higher requirements for the quality of life. In order to save more time to do the high quality work, we need to hand over more mechanical work to the machine to complete. Therefore, machine learning has made great contributions in many fields, including national defense security, capital maintenance, human-computer interaction, pattern recognition and so on. It is precisely because of the good results that the people of the country need it more. The development of hardware also ensures that it will have a bright prospect, so the research of target detection can be said to be of great significance. The emergence of deep learning have just adapted to the development of the times, in which convolution neural network, which has excellent performance because of the advantages of its own structural design, has drawn a heavy stroke in the development of target detection.

In this paper, the target detection algorithm is studied. The main research work includes: (1) the development background and present situation of target detection algorithm are introduced, and the significance of our research on it is also introduced.(2) some basic theoretical knowledge of target detection and some important technical applications are analyzed. (3) the core idea and practical effect comparison of some key results of target detection algorithm in recent years are briefly introduced.(4) the basic principle framework of Faster R-CNN algorithm is studied, and the improvement of its performance compared with the previous algorithms is analyzed.(5) on the PASCAL VOC2007 dataset, based on the Faster R-CNN algorithm, the ideal model is obtained by using the framework training of deep learning tensorflow, and the more accurate discriminant results can be obtained for the user input picture processing.

Key Words：Target detection; depth learning; convolution neural network; image recognition.

第1章绪论 1

1.1 研究背景及意义 1

1.2 国内外研究现状 2

1.3 本文的主要研究内容 3

1.4 本论文的结构安排 4

第2章卷积神经网络与目标检测概述 5

2.1 神经元 5

2.2 神经网络 7

2.3 反向传播算法与训练 8

2.4 卷积神经网络 9

第3章基于Faster R-CNN算法的目标检测 11

3.1 网络结构 11

3.1.1 R-CNN 11

3.1.2 Fast R-CNN 11

3.1.2 Faster R-CNN 12

3.2 特征提取网络 13

3.3 生成候选框RPN 14

3.4 分类回归网络 16

3.5 评价指标 17

第4章实验步骤及结果分析 20

4.1 数据集准备 20

4.2 实验环境参数配置及训练 22

4.3 模型评估 23

4.4 实验结果展示与分析 26

4.5 demo演示 28

第5章总结与展望 30

5.1 主要工作总结 30

5.2 目标检测算法的发展与展望 30

参考文献 32

致谢 34

第1章绪论

1.1 研究背景及意义

如今，经济和科技快速发展进步，国家实力、人民生活质量也受益于此得到了很大程度的提升，当然这种情况下导致了很多方面的一些变化，其中非常明显的是以下这些变化：人脸识别、手势识别、指纹识别、人眼识别等识别功能都开始被应用于许多高端的电脑、手机或公司的安防系统，因此对于整个社会的发展进步以及人们生活水平的提高，我们研究这个目标检测的方法可以说还是非常有意义的。

二十世纪六十年代起，物体识别与目标检测分类^[1]才开始被发掘出来，其实之前从来没有这样一个工具可以这样便于我们进行深度学习的，因此他的出现，夸张点来讲可以说是一场机器学习革命的前锋，一开始它的出现，主要是关于一些比较基础的图像识别和处理方面的，发展到现在这个时间，已经有对各种类别的目标识别，物体识别指的是对日常生活中图像或视频中的目标可疑物体进行探测识别并经过一系列处理将其提取出来加以区分标记以便进行下一步操作。随着高科技和人工智能的快速发展，目标检测产品对应的性能要求也越来越高，它要求我们能在各种场景下，即使是在比较模糊的情况下，也能尽量降低检测识别的差错率，因此物体别识别距离达到这种要求还有很多地方需要各界人士合力改进。

目标检测与分类所需要的关键理论和技术基础非常多，这是一个庞大的知识体系，并在不断发展扩增，实现自身完善，这些关键技术不仅包含卷积神经网络的复杂组合，还包含一些复杂的数据计算，除此之外还有复杂的分类器基础。

关于物体识别的方法算起来真的有很多种，比如，之前我们进行图像的目标检测时，常常利用SIFT^[2]和SURF^[3]来解决，再如我们若要进行行人检测，会采用HOG^[4]来处理，这也是长时间积累下来，才有的经验之谈。但是随着外界对这一系统的要求的变高，以前的经典的方法，虽然之前的效果还是可以的，但是，慢慢的，也要被淘汰了，新的方法的出现对于我们需求的满足是非常急切的，因为没有任何东西是可以一成不变的，时代一直在发展，时间的长流只会不断舍去不好的，不断发展有优势的。

由于近些年来我们见证了卷积神经网络的不断涌现并将引领深度学习的发展的趋势，采用基于卷积神经网络这一优秀的网络结构体系来实现我们的目标检测与识别课题，毫无疑问，肯定是最明智的选择。这样，既可以看看我们选用的卷积神经网络与传统意义上的目标检测算法相比，到底优秀在哪儿，还可以深入研究一下卷积神经网络能够与哪些技术或方法融合应用，探讨怎样的修改可以提升识别的正确率及效率。

1.2 国内外研究现状

一般情况下，从理论上来讲，目标检测指的是从任意给定的图像或视频中识别出并定位出我们所要找的目标物体，具体包括用定位框框出物体的具体位置并给出种类或者对目标物体给予特殊的颜色覆盖并跟踪。

虽然算法可能会不同，但是特征提取、特征处理以及物体分类一直是物体识别的主要的三个步骤。其中，特征提取在目标检测中最为关键，它是由许多个卷积层组成的，它的使用会让我们逐级提取出来输入图片的主要特征。对于特征处理，对提取的特征进行这种操作是因为先前特征提取后的特征比较粗糙，往往会出现噪声或冗余的信息，而特征处理就是用来对提取的特征进行细化降噪。特征处理后需要对特征图样进行分类，分类器对经处理后的极具代表性的特征图进行处理后可以对图片类型进行判别并予以标签。

特征提取这一步骤在整个目标检测的流程中是最为基础和关键的部分，特征提取质量的好坏直接影响到我们所学习的特征是否能最好的代表图片的最鲜明的特征，它这一部分的处理效果是逐层细化图片的轮廓形状等特征，越高层的卷积层提取的特征也是越高级的，从基本的线条纹理的描述，再到形状轮廓的细化，逐层精进。从这些年的发展来看，底层特征提取大致被分为了基于兴趣点的提取和密集提取，基于兴趣点的提取是只对图片中那些形状边缘分解线比较鲜明的特征的提取，这样的算法可以利用比较小的计算量得到最为有价值的特征表达，但是由于它的不全面性导致会遗漏一些特征，检测精度可能不太好。而密集提取就可以防止这种情况的发生，它是以固定的移动尺寸对整张图片进行特征提取，这样不会遗漏某些特征，但是它的计算量也是非常大的。综合最近几年的研究现状，综合这两种提取方法的设计方法用的比较多。

特征编码在目标检测中也是极为重要的一步，它是对之前提取的特征进行的处理，因为前一步提取的特征太多可能会有很多不必要的信息，所以我们需要一种处理对所提取的特征进行处理以得到更加精炼准确的表达即特征编码，这一操作对于提升目标检测的性能，减少计算量有着举足轻重的作用。它包含了早期不太成熟的向量化编码^[5]和稀疏编码^[6]，向量化编码是指利用量化使用视觉字典来压缩描述目标特征，稀疏编码近些年也得到了发展，一些具有代表性的设计表现性能经验证也是非常不错的。

提取的特征经过特征编码的处理后，一般需要对这些特征进行整合，我们称之为特征汇聚操作，最大值汇聚和平均值汇聚是我们常用的两种方法，其实质就是对特征图进行下采样操作，从经验上讲，最大值汇聚的优点更多，也被用的更多，这样做的优点是可以减小计算量，将其输入分类器也会更好计算。

经过特征汇聚后，特征图样已经被制成统一的格式，且能代表最高级的特征，之后将这些统一格式的特征表达输入到分类器中分类回归既可得到对应的输出判别，比较常用的分类器有支持向量机^[7]（SVM）和softmax分类器^[8]，支持向量机是二分类器，它在对简单分类的问题上能做到很好地效果，但是对于多分类的问题，还是softmax分类器更适合一些，由于数据的快速增长，多分类器更适用于我们处理问题的需要。

深度学习逐渐在各个领域发光发热，取得非常大的反响，大家都开始将目光投向它，但是在这个领域最具特色的设计就是卷积神经网络^[9]的结构设计，它的设计满足了我们大量处理用户数据并不断自身加强学习的特点要求，在某种程度上更像是人的脑力活动一样。

最近几年，人工智能领域的发展也是活跃的，每年都会有一些激动人心甚至令世人震惊的，举几个具有代表的例子来讲，在2015年，有百度公司研制的无人驾驶车终于在今年完成了路段测试任务，这为后来的无人驾驶奠定了基础，在2016年3月，在围棋比赛中，阿尔法狗打败李世石，这是人工智能的一个极大的进步，2017年，斯坦福大学团队发布了关于深度学习算法检测皮肤癌的文章，人工智能在医疗方面影响力越来越大，2018年春晚，无人车出现在了春节联欢晚会的舞台上，这也是无人驾驶取代传统驾车方式的前戏。

1.3 本文的主要研究内容

本论文研究了目标检测与分类的一些基本知识，关键性技术及它的发展后，选用了在原始基础上做了许多改进，并已被测试出不错性能的基于Faster R-CNN算法的目标检测的网络模型，具体的研究工作如下：

首先，我们对基于卷积神经网络的目标检测与分类的发展境况简单地分析和陈述总结，并对目标检测的一些最最基础的大体结构，每个结构负责什么任务进行了有条不紊的介绍。

接着，我们介绍了关于目标检测的最为关键的结构基础-卷积神经网络，介绍了它的基本组成以及它是如何工作的，以及它们用到的一些关键性算法的原理。

然后，我们先介绍了其他相关算法包括R-CNN、Fast R-CNN，在此基础上分析了基于Faster R-CNN算法的卷积神经网络在原有基础上的进步在哪些方面，做了这些改进后，网络得到了对应的哪些优势。

实验部分，我选用了使用 pascal voc2007 数据库对我们基于Faster R-CNN算法而搭建的神经网络架构进行了训练与测试，并用统计评估模块对，测试的结果进行了数据指标上的评价，包含了精确度和效率指标，挑选了一些图片结果进行效果分析评估，最后输入实际生活中的图片进行可行性验证得到了良好的处理结果。

最终，借效果不太好的地方，分析原因提出可能有效的改进方案，对目标检测整个进步大方向的做了个人预测，发表了一些看法。

以上是毕业论文大纲或资料介绍，该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取，微信号：bysjorg。

注册

找回密码