登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 通信工程 > 正文

基于卷积神经网络的图像分类研究与实现文献综述

 2020-04-14 05:04  

1.目的及意义

1目的及意义

1.1研究目的及意义

随着科学技术的不断发展和进步,图像已成为当今信息的主要载体之一。也正是因为图像作为信息载体的使用越来越普遍,现在越来越多的人更愿意使用图像来传输和获取信息。由于图像在人们生活中的重要性越来越高,今天的图像数量也在迅速增长。面对海量图片,我们需要开发一种合理、高效、快速的方法来分析和处理大量的图像信息,从而大大提高人们寻找有用图片信息的效率,从而为我们的日常生活提供极大的便利。然而,如果只使用手工方法对图片进行分类,就需要我们付出大量的人力资源。对图片进行分类的人会花费大量的时间做重复的工作,这必然会导致效率低下;个人知识储备的总量和能量总是有限的,这意味着对图像分类结果的准确性有一个上限。如今,计算机作为新时代的生产力工具,其计算效率远高于人类,只要操作条件正确,计算结果就不会出错。这就使得使用计算机而不是人来进行图像分类和识别变得十分必要。

卷积神经网络(CNN)是一种前馈神经网络,其人工神经元能够对部分覆盖区域的周围区域作出反应,并能很好地进行大图像处理。CNN主要用于识别二维图形的位移、标度等形式的畸变不变性。这部分功能主要由池层实现。由于CNN的特征检测层是通过训练数据学习的,所以在使用CNN时,避免了显式特征提取,而学习是从训练数据中隐式学习的;而且,由于同一特征映射面上的神经元权重相同,所以网络可以并行学习,这也是卷积网络的一大优势。相对于相互连接的神经元网络。卷积神经网络以其特有的局部权值分担结构,在语音识别和图像处理方面具有独特的优势。其布局更接近于实际的生物神经网络,重量分担降低了网络的复杂性,特别是多维性。输入矢量图像可以直接输入到网络中的特征,避免了特征提取和分类过程中数据重构的复杂性。正是由于卷积神经网络的这些特点,利用卷积神经网络对图像进行识别和分类已成为图像分类的主要研究方向。

1.2国内外研究状况

卷积神经网络(CNN)是一种常见的深度学习架构,受生物自然视觉认知机制启发而来。1959年,Hubelamp; Wiesel发现,动物视觉皮层细胞负责检测光学信号。受此启发,1980年 Kunihiko Fukushima提出了CNN的前身neocognitron。

20世纪90年代,LeCunet al等人发表论文,确立了CNN的现代结构,后来又对其进行完善。他们设计了一种多层的人工神经网络,取名叫做LeNet-5,可以对手写数字做分类。和其他神经网络一样,LeNet-5也能使用backpropagation算法训练。

CNN能够得出原始图像的有效表征,这使得CNN能够直接从原始像素中,经过极少的预处理,识别视觉上面的规律。然而,由于当时缺乏大规模训练数据,计算机的计算能力也跟不上,LeNet-5对于复杂问题的处理结果并不理想。

2006年起,人们设计了很多方法,想要克服难以训练深度CNN的困难。其中,最著名的是 Krizhevsky et al提出了一个经典的CNN结构,并在图像识别任务上取得了重大突破。其方法的整体框架叫做AlexNet,与LeNet-5类似,但要更加深一些。AlexNet取得成功后,研究人员又提出了其他的完善方法,其中最著名的要数ZFNet,VGGNet,GoogleNet和ResNet这四种。从结构看,CNN发展的一个方向就是层数变得更多,ILSVRC2015冠军ResNet是AlexNet的20多倍,是VGGNet的8倍多。通过增加深度,网络便能够利用增加的非线性得出目标函数的近似结构,同时得出更好的特性表征。但是,这样做同时也增加了网络的整体复杂程度,使网络变得难以优化,很容易过拟合。

2014年,ChristianSzegedy等人提出了GoogLeNet。该网络最大的贡献是Inception结构。该结构的发现源于寻找最优局部网络结构的思想。2015年,SergeyIoffe等人提出了批标准化。这一结构作用于网络中的各个激活函数之前。为消除网络中各层输出分布中体现的内部协方差偏移,该结构用可训练的参数为各层净输出进行线性映射,保证了网络中各层的输出分布基本稳定,输出幅度也保持在同一尺度。它同时大大降低了网络对初始参数的依赖,提升了网络中梯度传递的效率,大幅提升了网络速度。并且其在每一层对网络输出的纠正作用使得深层网络的训练真正成为可能。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图