基于Mask R-CNN的目标检测分割研究开题报告

2020-04-12 08:04

1. 研究目的与意义（文献综述）

在机器学习中，卷积神经网络是一种深度前馈人工神经网络，已成功地应用于图像识别。卷积神经网络，是一种前馈神经网络，人工神经元可以响应周围单元，可以大型图像处理。卷积神经网络包括卷积层和池化层。卷积神经网络是近年发展起来，并引起广泛重视的一种高效识别方法。20世纪60年代，hubel和wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络（convolutional neural networks-简称cnn）。现在，cnn已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。 k.fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后，更多的科研工作者对该网络进行了改进。其中，具有代表性的研究成果是alexander和taylor提出的“改进认知机”，该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。

神经网络在 2012 年崭露头角，alex krizhevsky 凭借它们赢得了那一年的 imagenet 挑战赛，他把分类误差记录从 26% 降到了 15%，在当时震惊了世界[1]。自那之后，大量公司开始将深度学习用作服务的核心。facebook 将神经网络用于自动标注算法、谷歌将它用于图片搜索、亚马逊将它用于商品推荐、pinterest 将它用于个性化主页推送、instagram 将它用于搜索架构。

受到多伦多大学hinton实验室研究工作的启发，加州大学伯克利分校jitendra malik教授领导的团队，提出了一个在如今看来好像是不可避免的问题：能否将krizhevsky等人提出的网络模型泛化应用到对象检测上？对象检测技术是一项通过标出图像中不同对象并对其进行分类的任务。在对象检测挑战赛pascal voc上，由ross girshick，jeff donahue和trevor darrel组成的这个团队，发现这个问题可以通过krizhevsky的研究成果来进行解决。他们由此提出了regions withcnns (r-cnn)架构[2]。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 研究的基本内容与方案

基本内容：

1）阅读相关文献，了解RCNN,Fast RCNN,FasterRCNN，Mask RCNN,分析并比较各种模型的识别率和识别速度，并重点研究Mask RCNN模型，了解其原理和优缺点。

2）在GPU上实现MaskR-CNN模型

3）研究TensorFlow的GPU编程技术，通过GPU实现模型

4）在复现基础上，对Mask RCNN在目标切割识别上做进一步的扩展研究。

5）提出网络模型在现实中的应用扩展，并对于Mask RCNN模型的缺点尝试研究，提出解决方案。

目标：

1）在PC机上实现R-CNN，Fast R-CNN,Mask R-CNN.针对数据集进行性能测评，分析比较识别率和识别速度。

2）在Ubuntu上搭建安装CUDA，搭建TensorFlow平台，并通过多核并发编程加速算法执行。

输入图像

ROIAlign

conv

输出

Class

box

Mask-RCNN 的网络结构示意

拟采用的技术方案及措施：

复现的Mask R-CNN是基于Python3，Keras，TensorFlow。下载模型在COCO数据集上预训练权重, 在COCO数据集上训练, 使用COCO数据集.

1)数据预处理,加载数据集,BoundingBoxes(bbox), 调整图片大小, Mini Mask、Anchors

2)在自己的数据集上训练模型, 构建个人数据集, 训练模型,模型预测

3)Mask R-CNN 模型分析, 区域候选网络, RPN Target, RPN Prediction, Proposal 分类, 生成Mask, PredictedMasks

3. 研究计划与安排

第一阶段（第1周—第3周）：查阅有关的参考资料并完成开题报告；翻译英文资料（不少于5000汉字），并交予指导教师检查。

第二阶段（第4周—第9周）：了解卷积神经网络主流模型，分析并比较各模型的识别率、优缺点，重点研究maskr-cnn。

第三阶段（第10周—第13周）：在tensorflow上实现maskr-cnn。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

4. 参考文献（12篇以上）

[1]alex, krizhevsky,ilya, sutskever, geoffrey, e, hinton. imagenet classification with deepconvolutional neural networks[j]. communications of the acm cacm homepagearchive, 2017, 6(60): 84-90

[2] md zeiler, r fergus.visualizing and understanding convolutional networks[c]. zurich: europeanconference on computer vision, 2014. 818-833

[3] k simonyan , azisserman. very deep convolutional networks for large-scale imagerecognition[j]. computer science, 2014

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码