基于强化学习与关注区机制的遥感影像语义描述网络开题报告

 2020-02-10 10:02
1.目的及意义(含国内外的研究现状分析)

1.1研究背景

近年来,深度学习在计算机领域图像识别和自然语言处理等方面展现了优异的性能[1]

2006年在Kumar等人[2]实现了卷积神经网络( Convolutional Neural Network,CNN)在GPU上的高效率运行后,CNN的进入了飞速发展阶段。2012年-2015年又有AlexNet、VGGNet、GoogLeNet、ResNet等优秀CNN网络结构被提出[3][4][5][6],并在计算机图像识别领域取得了瞩目的成果,分类精度有了大幅提升。2015年,Long等提出了用于图像语义分割的全卷积神经网络( Fully Convolutional Neural Network,FCN)[7],其在CNN的结构基础上,采用反卷积层对最后一个卷积层的特征图( feature map)进行上采样,实现了图像像素级类别预测,开辟了图像分割的新领域,成为了图像语义分割方向的热门且经典的网络。其后在FCN基础上衍生出的U-Net、DeepLab等语义分割网络[8][9],都取得了很好的效果,为图像的实例分割等奠定了基础。

2014年,图像自然语言描述( Image Caption)的兴起提供了一条新研究方向[10]。为了解决生成的描述性词语与图像内容对应的问题,关注区(Attention)机制逐渐被应用到图像自然语言描述领域中来。Attention机制最早是在视觉图像领域提出来的,2014年Google Mind团队在RNN模型上使用了Attention机制来进行图像分类[11]。随后,Bahdanau等人使用类似Attention的机制在机器翻译任务上将翻译和对齐同时进行[12],首先将Attention机制应用到自然语言处理( Natural Language Processing,NLP)领域中。在之后的众多研究中[13][14],都可以看到前端利用编码器对图像进行编码(如CNN提取图像特征),中间利用Attention机制将关注的特征对齐到文本,后端再采用解码器解码(如利用长短期记忆网络生成描述性语句)的图像自然语言描述模式。

Attention机制不仅在自然语言与图像内容的对齐上有着应用,关注区的方法还在对象检测中有着重要应用。在2016年的一项研究中,Zhou等人提出了一种基于CNN的网络(Class Activation Mapping,CAM),进行图像分类的同时还能够针对图片中的关键部分进行定位[15]。由于其与类别相关的关键部分往往与特殊的对象有关,故在一些研究中,通过利用这种CAM提取关注区时的特性,设置阈值绘制外包矩形后能实现对象检测的效果[16]

而在遥感领域,现代遥感从60年代发展至今,由数据匮乏到现在“泛滥”,大量的遥感数据需要去分析。由于深度学习算法在图像分类和分割领域的杰出效果,且考虑到遥感影像处理和一般原始影像存在一定的相似性,越来越多的学者研究如何将计算机领域的图像处理深度学习算法移植到遥感领域中来。

国内学者研究中,刘大伟等提出了一种基于深度学习的遥感图像分类算法,该算法利用深度学习深层信念网络(Deep Belief Network,DBN)对基于光谱和纹理特征的高空间分辨率遥感图像进行分类[17]。曲景影等提出了一种基于CNN的遥感图像分类算法,该算法在传统的LeNET-5 网络的基础上利用ReLU代替Sigmoid和Tanh 激活函数,对光学遥感图像进行识别时取得了一定的效果[18]。周敏等提出了一种将CNN用于遥感图像飞机目标分类问题的算法,该算法设计了一个五层卷积神经网络进行分类[19]。黄洁等提出了一种将深度学习网络应用于遥感图像船舰目标检测的算法,该算法将卷积神经网络与支持向量机分类器(SVM) 相结合实现遥感图像分类[20]。虽然现有基于深度学习的遥感图像分类算法能有效提升分类性能,但是仍存在未能有效融合多种深度特征、分类器性能欠佳的问题[21]

您需要先支付 5元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,微信号:bysjorg 、QQ号:3236353895;