登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 电子信息工程 > 正文

深度学习中图像数据扩增方法初步研究开题报告

 2020-02-18 04:02  

1. 研究目的与意义(文献综述)

在传统模式教育教学中,测评学生知识水平的主要渠道是通过考试,并且以纸质试卷考试为主要手段,整个试卷评阅过程费时耗力。近年来,随着计算机理论与技术为背景的人工智能运用的不断普及,这项研究已成为当今计算机技术研究领域中的热点问题。在自动化智能评阅试卷研究中,许多研究人员也希望能够进一步将人工智能(artificial intelligence, ai)技术引入该领域,更好地发挥计算机的自动计算能力。目前,对于选择、填空等客观题型的自动评阅技术已经很成熟。但是,对于主观题的自动评阅技术尚在探索之中。对主观题自动评阅研究第一步就是要准确识别出考生的手书答案,它依赖于脱机手写体汉字识别(offline handwritten chinese character recognition, offline-hccr)技术的成功。offline-hccr 是指将用硬笔或软笔手工书写在纸质介质上的文字进行机器识别,

它主要包括特征提取和分类两个阶段。特征提取用于从原始输入中提取能表达特定汉字本身而又区别于其他汉字的无冗余性的低维图像特征。常用的汉字特征包括结构特征、统计特征以及包含结构和统计的混合特征。常用的具体分类方法包括二元线性分类器支持向量机[1](support vector machines, svm)、模拟人脑运行机制的人工神经网络[2](artificial neural network, ann)分类器以及修正的二次判别函数[3](modified quadratic discriminant function,mqdf)等。汉字是华夏民族发展至今的文化产物,对于其手写体的准确识别有着重要的现实意义和价值。在过去的三十年里,科学界针对 offline-hccr 已经做了大量的研究工作[4],取得了一些进展,但多数成果仍处于实验室阶段,市场上鲜有普及型产品。汉字识别是人工智能与模式识别研究领域的一个重要分支。近年来,随着基于神经网络模型的深度学习[5](deep learning)方法研究领域的迅速发展,基于深度神经网络的图像特征提取与分类方法在模式识别领域得到了极大的成功,并被广泛应用于图像识别和语音识别等各个方面[6]。其中,作为拥有优秀图像识别能力的深度学习方法,深度卷积神经网络[7](deep convolutional neural network, dcnn),得到了越来越多在理论和应用方面的研究。事实上,dcnn 模型是由cnn 模型[8]衍变而来,它是拥有多个隐含层的卷积神经网络,具有自适应提取图像几何不变性特征的能力且模型参数少,运用该模型进行图像识别时,速度快、准确率高。在近几年的文档分析与识别国际会议[9,10](international conference on documentanalysis and recognition, icdar)举行的脱机手写体识别竞赛中已经被广泛采用。与基于人工设计或定制图像特征的传统方法相比,dcnn 模型能够自适应因手写风格不一致而产生的各种汉字变形,并有效提取汉字图像特征,以保证有较高的识别率。但是,在运用 dcnn 模型解决识别问题时,需要针对不同的识别对象设计不相同的 dcnn 模型。因此,研究 dcnn 模型高识别性能的原因,并探索设计最佳 dcnn 模型的问题或补充 dcnn 模型的理论知识,对于解决脱机手写体汉字识别等具体应用问题有很好的实际应用价值。

信息交流与通信、新闻媒介、办公自动化、手写试卷的智能判卷等多方面的日常工作,都可能涉及到计算机对汉字的自动识别,而手写体汉字识别的研究尤其具有使用价值和应用前景。手写体汉字识别的研究可分为脱机手写体汉字识别和联机手写体汉字识别两种。目前,因为可以根据书写时的笔画顺序、点的坐标等动态信息对汉字进行识别,准确率也较高,联机手写体汉字识别技术已相对比较成熟,市场有很多产品普及,如汉王科技、文通公司的产品。然而,对于脱机手写体汉字的研究进程却是缓慢的。近 40 多年来,各国学者,尤其是日本和我国研究人员在这方面做了大量工作,提出了各种解决思路与方法。目前来讲,已发表的研究论文和技术报告大都着重讨论如何选择特征和匹配方法以适应手写体汉字字形的变化。研究中的实验数据集都是针对特定的已知手写体汉字集合,为多数人所接受的标准手写体字符库还没有真正确立,仍需做进一步研究。由于手写汉字使用的更为广泛,

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

基本内容及目标

通过对图像数据扩增的学习实现对手写体汉字的识别研究

1) 学习深度学习的相关知识

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排

1) 第1-3周 完成题目调研,完成文献阅读,进行相关资料的收集,完成文献综述以及开题报告撰写;

2) 第4-7周 学习深度学习相关只是理论,以及卷积神经网络的知识;

3) 第8-12周 完成脱机手写汉字的识别;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 高灿.基于卷积神经网络的脱机手写汉字识别系统研究[d].安徽理工大学,2017.

[2] 柴伟佳, 王连明. 卷积神经网络的多 字体汉字识别[j]. 中国图象图形学, 2018.

[3] 周星辰.基于深度模型的脱机手写体汉字识别研究[d].浙江大学.2016.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图