登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 电子信息类 > 通信工程 > 正文

手写体数字识别技术研究开题报告

 2020-04-13 11:04  

1. 研究目的与意义(文献综述)



武汉理工大学
本科生毕业设计(论文)开题报告

1、目的及意义(含国内外的研究现状分析)



1.1 研究目的及意义(800)

在信息高速发展的今天,手写字符识别技术一直是占有重要地位的角色,手写体字符识别是手写体字符识别的一个重要分支,手写体数字识别大致可以分为脱机手写数字识别与联机手写数字识别两大类。利用书写板人工地且实时把数字输入计算机的方法称为联机手写数字识别,这是一种把笔画变成一维电信号的方法,输入的是一连串表示笔尖移动轨迹的坐标点,所以联机识别比脱机识别要容易一些。它通过记录文字图像的起笔,落笔以及笔记上各像素的空间位置和各处的时间关系等关系信息,系统按照一定的规则对以上这些信息进行处理,在处理的过程中,系统按照一定的规则提取手写体数字信息的特征,借由识别模块将提取的信息与识别库进行比较并加以识别,最终转化为计算机使用的文字代码。而脱机手写数字识别处理的是二维数字点阵图像。

一般涉及到数字识别的情况时,人们往往要求识别系统具有很高的识别精度,尤其是有关金额的数字识别。所以针对这些问题就要求数字识别系统具有高识别率,而难点主要是以下几方面:

1、阿拉比数字的字形信息量不足,不同数字由于写法问题导致相差并不大,使得准确区分某些数字十分困难。

2、数字虽然只有0-9十种,但同一数字的书写会因为不同地域的人的写法而千差万别,因此要做到极高识别率的通用数字识别系统目前还有一些难度。

3、在实际应用中,对数字的单字识别正确率的要求比文字苛刻许多。主要原因是文字组合一般存在较为明显的上下文关系,但数字组合有较大的随意性,导致每个数字的识别都极为重要。而且数字常常会与财会、金融联系在一起,其重要性不不言而喻。因此,对于数字识别系

统的要求就不单单是高正确率,更为重要的是极低的,千分甚至万分之一的误识率。

4、由于脱机手写数字的输入是简单的一幅图,不像联机输入那样可以从物理设备上获得字符的笔画顺序,这也是脱机手写数字识别的一个挑战性的问题。

随着网络的普及,越来越多的数据要输入计算机网络。而且这些在实际生活中有着广泛的应用(如:银行票据识别、工商报表、邮件自动分拣、大规模数据统计)。所以,对于手写体字符识别的研究兼具现实应用意义及理论学术意义。

1.2 国内外研究现状

目前研究手写体的数字识别方法有以下六种:

(1)、模板匹配法

模板匹配法是模式识别中常用的基本方法之一。基本原则是:对每个模式都定义一个标准的模式并将它当做模板,这种方法适用于印刷字符或受到相当限制的手写体字符,对于脱机手写数字这种方法很难适用。

(2)、统计决策法

统计决策法是模式识别的一个经典方法,它是在概率论和数理统计的基础上产生和发展起来的,一位极其严格的数学基础,此方法发展的较为成熟。而且它也是模式识别中能用严格的数学计算来识别字符的方法之一。该方法抗干扰能力较强,但是较难抽取到好的特征且难以反映模式的精细结构特征。

(3)、句法结构法

句法结构法是在形式语言和自动机的基础上产生的,它能反映模式的结构特征,而且对模式的结构特征变换不敏感,因此多用于联机识别,但由于抽取字符的基元比较困难,因而不是特别适合脱机识别,同时这一方法的理论基础并不可靠,抗干扰能力较弱。

(4)、模糊识别法

模糊识别法的理论基础是模糊数学,用隶属度将模糊集合模式类划分为若干子集,子集总数与模式的类别总数相同,然后根据择近原则分类,由于隶属度函数度量了未知样本同标准模式之间的相似程度,所以此方法能够反映出字符模式的整体特征,并且允许待识样本有一定的变形以及干扰,只是要建立合理的隶属度函数有一定的困难。

(5)、逻辑推理法

逻辑推理法以人工智能为基础。基本原理是:运用知识库中放入规则从事实出发进行推理得到相应的结果,而每个结果都是相应的模式类。所谓知识就是待识字符的构成规律。此法的缺点是难以得到待识字符的事实。

(6)、神经网络法

神经网络法利用神经网络和记忆功能,让神经网络学习个个模式类别中的大批训练样本,以记住模式类别中的样本特征,然后在识别待识样本时将他们逐个与记忆中的各模式类别的样本特征相比较,从而确定样本所属的类别。神经网络法通过自身的学习机制形成决策区域,不需要给出有关模式的经验知识和判别函数,其特征有拓扑结构神经元特性决定,通过对不同状态的信息逐一训练而获得某种映射。此方法的缺点是过分依赖特征向量的选取。为尽可能全方位描述手写体数字的特征,研究者从不同的方面抽取相应的结构特征或统计特征。单一识别网络的输入向量维度通常不能太高或者太低,太低学习达不到精度,太高则导致网络规模过大,瘦脸困难。因此所选抽取特征向量的各分量应当具备足够的代表性,才能够取得较好的识别效果。在实际应用中,综合神经网络和Bayes分类器的优势能够具有更好的综合分类效果,只是需要的训练样本数较多。支持向量机(SVM)方法是九十年代初出现的新的分类方法,SVM方法可以解决神经网络方法中的局部极值问题,从理论上说是全局最优的,支持向量机制在数字识别领域也是一个值得研究的方面。

对于应用神经网络识别,手写数字的研究主要集中在两个方面。

一是研究用于识别的神经网络,首先是对神经网络的结构的研究,目的是设计出适合手写数字的神经网络结构。神经网络结构有通用多层全连通网络、遗传神经网络、多层分组网络,合适和图像识别的卷积网络等等。这是网络算法的研究。最经典是反向传播(BP)算法,在手机处上衍生了许多改进算法,比如加入动态量的改进算法、基于遗传算法的BP算法等等。

二是研究于神经网络输入的手写数字特征的提取。许多有效的特征被提出来,例如轮廓特征、网络特征、傅里叶变换特征、对称特征(Symmetry Features)等等。并且提出了用于筛选特征的特征选择方法,,比如K-W法、直方图方法、不确定选择法、递归特征淘汰法等。提取适应性很强,识别各种手写体风格的特征集仍是一个难点。


2. 研究的基本内容与方案


2.1设计的基本内容

1. 针对手写数字应用神经网络的方法需设计一个多层的卷积网络,该网络应通过共享权值,使得连接权数量减少,减少网络规模。

2. 介绍网络训练的算法,并提出改进的办法:优化激励函数、随机输入样本,将修改权值的算法上引入二阶方法,以及忽略某些反向传播过程等,改善训练效果和效率。

3. 通过一系列有效的预处理,从待识别图像中提取单个字符,利用神经网络分类器识别出手写体数字对应的数值。

2.2 技术方案


如上图所示,数字识别时,首先将写在纸上待识别的数字,经过光电扫描,产生模拟电信号。之后通过模数转化为大灰度的数字信号输入计算机。纸张厚度、洁白度、光洁度、油墨深浅、印刷或书写质量都有可能造成字形畸变,进而产生污点、飞白、断笔、交连等干扰。输入设备的鉴别率,线性度,量化过程也会产生噪声。所以在数字识别之前,要对带有随机噪声的字符灰度值,数字信号进行预处理。

预处理一般包括二值化、行字切分、平滑、去噪声、规范和细化等。不同的识别方法,对预处理的项目和要求有所差别。有的方法对字符的规范化预处理可以从简,甚至不要。有的识别方法,对细化预处理要求很高。有的不需要细化等。






3. 研究计划与安排

3、进度安排

1-3周:完成论文开题

4-6周:完成理论相关技术理论研究,

7-10周:完成本课题的理论与技术研究内容

11-13周:完成相关实验与验证工作

14-16周:完成论文的撰写及答辩准备工作

17周:论文答辩

4. 参考文献(12篇以上)

4、参考文献

[1] Yanwei Wang et al. Importance samplingbased discriminative earning for large scale offline handwritten Chinesecharacter recognition. Pattern Recognition 48 (2015) 1225–1234.

[2] Xuefeng Xiao et al. Building fast and compact convolutional neuralnetworks for offline handwritten Chinese character recognition. PatternRecognition 72 (2017) 72–81.

[3] Hao Wu et al.Optimized CNN Based Image Recognition Through TargetRegion Selection. Optik 156 (2018) 772–777.

[4] 温荷. 基于PCNN改进算法的手写体识别研究[J]. 计算机科学, 2016, 43(2):316-318.

[5] 刘猛.云计算平台下神经网络方法研究[D].电子科技大学,2011

[6] 杨小燕.基于改进BP网络的软件项目风险评价研究[D],东北师范大学

[7] 王慧.基于模版匹配的手写体字符识别算法研究[北京交通大学硕士学位论文],北京交通大学,2012

[8]李艳,张自立,吕建红.一种基于CMAC神经网络的板形模式识别新方法.河北工业科技,2014,31(3);209-214

[9]苏云,张庆来,面向海量文献的数字化技术研究.图书与情报,2010,154(02):85-89

[10]黄泉龙.基于PCA的人脸识别研究[D].西安电子科技大学,2012

[11]晏丹琳.基于PCA的车牌识别算法研究[D].西安电子科技大学,2012

[12]刘润田.基于Hopfield神经网络的脱机手写数字识别分析与研究[D].郑州大学,2011

[13] 阮秋琦.数字图像处理学.第二版.北京.电子工业出版社,2007.178-234

[14] 王晅,马建峰.数字图像分析与模式识别.北京.科学出版社.2011.256-277.

[15] 曹丹.基于Hopfield神经网络的脱机手写数字识别[学位论文].长沙.中南大学,2009.2-3

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图