登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

基于深度学习方法的复杂场景下目标检测毕业论文

 2021-12-22 09:12  

论文总字数:18095字

摘 要

在当今社会,计算机的发展可谓是日新月异,计算机的应用领域也在逐年不断增加。近年来,人们希望计算机能够拥有属于自己的思考,可以自己智能化地处理一些主观的,非形式化的问题,目标检测就是其中的典型代表。在此之前,计算机可以很容易的解决可以用形式化的数学规律来描述的问题,但对于识别图像中的物体却无法给出计算机自己的判断。

本研究旨在对深度学习目标检测领域中的Faster R-CNN进行研究,掌握Faster R-CNN的原理,并且能够熟练的运用。本研究是建立在Faster RCNN模型的基础之上,模型使用vgg16预训练模型对图像进行特征提取,使用RPN(Region Proposal Network)网络产生候选区域,最后使用全连接层完成图像的分类和回归框的定位。模型使用PASCAL VOC 2007数据集进行训练并最终搭建一个简单的UI界面对结果进行测试以符合预期效果。本系统使用TensorFlow实现目标检测。

本论文首先介绍了目标检测的背景和意义,然后分别从模型的搭建、模型的训练、以及最终的模型测试等方面对目标检测的设计思路与实验的实现过程进行详细的介绍。最后对本次研究与实验进行总结。

关键词:深度学习 目标检测 Faster R-cnn TensorFlow Pytorch

Target detection in complex scene based on deep learning method

Abstract

In today's society, the development of computer is changing with each passing day, and the application field of computer is increasing year by year.In recent years, people hope that the computer can have its own thinking, can handle some subjective and informal problems intelligently, and target detection is a typical representative. Before this, the computer can easily solve the problem that can be described by formal mathematical laws, but it can't give the computer's own judgment for identifying the objects in the image.

The purpose of this study is to study faster r-cnn in the field of deep learning object detection, master the principle of faster r-cnn, and be able to use it skillfully. This research is based on faster RCNN model, which uses vgg16 pre training model to extract image features, uses RPN(Region Proposal Network) network to generate candidate areas, and finally uses full connection layer to complete image classification and regression box positioning. The model uses Pascal VOC 2007 data set for training and finally builds a simple UI interface to test the results to meet the expected results. This system uses tensorflow to realize target detection.

This paper first introduces the background and significance of target detection, and then introduces the design idea and the realization process of the experiment from the aspects of model building, model training, and the final model testing. Finally, the research and experiment are summarized.

Key words: Deep learning; object detection; Faster R-cnn ; TensorFlow; Pytorch

目 录

摘 要 I

Abstract II

第一章 前言 1

1.1研究目的及意义 1

1.2国内外研究现状 1

1.2.1国外研究现状 1

1.2.2国内研究现状 2

1.2.3总结 2

1.3 目标检测技术的发展 2

1.3.1传统目标检测的发展 2

1.3.2基于深度学习的目标检测技术发展 3

1.4章节安排 3

第二章 技术介绍 4

2.1卷积神经网络(CNN)的简要介绍 4

2.1.1神经网络的组建 4

2.1.2卷积神经网络的层级结构 4

2.1.3 总结 6

2.2从RCNN到Faster RCNN 6

2.2.1 RCNN 6

2.2.2SPP 7

2.2.3Fast RCNN 8

2.2.4Faster RCNN 9

第三章 基于TensorFlow的目标检测 11

3.1Faster RCNN模型 11

3.1.1模型简介 11

3.1.2模型结构 11

3.1.3实现方法与细节 12

3.1.4损失函数 14

3.2实验简介 14

3.3数据集介绍 14

3.4 实验流程 15

3.4.1数据准备阶段 16

3.4.2数据训练阶段 16

3.5 实验结果 18

第四章 总结 20

参考文献 21

致谢 23

第一章 前言

1.1 研究目的及意义

近年来,人们希望计算机能够智能化地处理一些主观的,非形式化的问题,目标检测就是其中的典型代表。目标检测一直是计算机视觉领域经久不衰的研究方向。 近年来,传统的方法在预测精度和速度上都不理想。深度学习的出现,特别是卷积神经网络的高速发展以及各种深度模型的广泛应用,都极大地推动了图像,音频等领域的发展。

本论文主要研究了基于深度学习的卷积神经网络在目标检测上的应用与实现。本文会介绍一种端到端的可训练的目标检测框架,并且从单目标检测以及多目标检测两方面来实现。论文研究并实现了基于Faster RCNN的卷积神经网络,并利用研究成果,实现了一个基于Faster R-cnn的目标检测系统,实现了深度卷积神经网络的实际应用。

1.2 国内外研究现状

深度学习技术目前是个十分火热的领域,无论是国际上还是国内都在积极的研究深度学习。

1.2.1 国外研究现状

在国际上许多著名的公司在深度学习方面取得了不错的进展,其中以Google公司和Facebook等公司的贡献最为显著。谷歌的推出MediaPipe Objectron能够在手机上就完成对3D物体的实时目标检测,它检测出2D图像中的目标后通过3D数据集上的机器模型来计算3D目标的边界框,对目标的姿态和大小进行评估。Google提出的视频检测方法能够高效实时的实现视频目标检测,并且它在移动设备上实现了目前最快的检测速度。Google大脑的新型目标检测器EfficientDet以之前产品1/4的规模达到了9.3倍的flops。Facebook AI实验室的提出的VoteNet能够对原始数据直接进行处理,并且不需要依靠2D检测器就能够独立完成对3D场景中对象的检测。而FoveaBox算法则是让目标检测不在需要依赖于候选框。

1.2.2 国内研究现状

创新奇智在目标检测领域多次刷新全球排行榜,其提出的AInnoDetV2算法在MOT Challeng上取得了第一名的好成绩,并且还被应用到了许多工业领域。在今年的AAAI 2020上华科Oral提出的TANET在难度较大的噪声环境中仍能够出色的完成3D目标检测任务,实现了检测性能和稳健性的提升。阿里图灵实验室则是两年三次刷新Pascal VOC最佳纪录。中科院沈阳自动化所等单位的学者提出一种不需要其他外部数据的实时的单目3D目标检测算法RTM3D,这是首个实时单目3D目标检测算法。李沐等研究者在目标检测的精度上做出了很大的贡献,将精度提升5%与此同时还保证目标检测的速度没有下降。百度则是提供了“飞桨”这样一个深度学习平台,方便了国内开发者的学习,目前飞桨拥有超190万的用户,并且飞桨是国内唯一支持量子机器学习的深度学习平台。

1.2.3 总结

目前,国内外的目标检测的发展趋势都在逐渐从2D目标检测向3D目标检测转变,由图像目标检测向视频目标检测转变,并且越来越追求实时性。同时,越来越多的公司选择将自己的研究开源,使得目标检测不再是遥不可及,让越来越多的开发者能够加入到这个领域中。并且NVIDIA还开设公开课向开发者分享目标检测开发经验。现在,目标检测领域不再是单独的国内发展和国外发展,许多优秀的算法都是由国内外专家共同研究,比如华为就与莫斯科国立大学共同研究出了对抗样本攻击方法。

1.3 目标检测技术的发展

1.3.1 传统目标检测的发展

传统的目标检测算法包括三个步骤:

请支付后下载全文,论文总字数:18095字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图