基于BP神经网络的手写数字识别算法比较研究与实现文献综述

2020-04-23 19:39:01

1．目的及意义

手写数字识别(Handwritten Numeral Recognition)是光学字符识别技术(Optical Character Recognition,简称OCR)的一个分支，它研究的对象是：如何利用电子计算机自动辨认人手写在纸上的阿拉伯数字。

1929年德国科学家Taushek利用光学模板匹配识别文字，开创了用机器识别文字符号的先河^【7】。欧美国家为了大量的资料信息输入计算机中处理，所以从50年代就开始了OCR研究。最早的OCR系统出现于20世纪60年代初，它们只能识别有限字型的字符。其中最具代表性的是OCR420，它能识别特定字体的字符。另一个具有代表性的OCR系统是Farrington3010，同NCR420一样，它也只能识别一些特定字体的字符。七十年代初，Parks 等介绍了一种抽取拓扑特征的特征抽取法以及多级结构链接的识别方法^【6】。1971随后，日本对汉字识别进行了研究，并于1980年进行了印刷体汉字识别的公开表演^【5】。这个时期的OCR系统的主要特点是能够识别比较工整的手写体字符。一个著名系统是IBMl287，它利用了数字技术和模拟技术实现了这一功能。第一台邮政编码自动分拣机有日本的Toshiba公司研制成功，后来NEC也推出了自己的邮政编码自动分拣机。八十年代以后，随着个人计算机的出现，CCD平板式扫描仪的商品化，字符识别技术得到了蓬勃发展。许多研究者将人工神经网络^【9】、小波变换、分形、模糊理论、支持向量机^【15】等新技术及研究手段引入到OCR技术的研究中，并取得了不错的成果。此时的OCR系统的目标是使计算机能处理更复杂的一般情况，经过多年的研究和发展，目前，印刷体字符识别和能够借助笔画顺序特征的联机手写体字符识别已经进入到广泛的应用阶段，已经出现了非常多的识别效果很好的商业产品。

中国在OCR技术方面的研究工作相对起步较晚，在20世纪70年代才开始对数字、英文字母及符号的识别技术进行研究，20世纪70年代末开始进行汉字识别的研究。1986年，国家863计划信息领域课题组织了清华大学、北京信息工程学院、沈阳自动化所三家单位联合进行中文OCR软件的开发工作。1989年，清华大学率先推出了国内第一套中文OCR软件一清华文通，至此中国的OCR技术正式从实验室走向了市场。上个世纪90年代中后期，清华大学电子工程系提出并进行了汉字识别综合研究，使汉字识别技术在印刷体文本、联机手写汉字识别、脱机手写汉字识别和脱机手写体数字符号识别等领域全面地取得了重要成果。删具有代表性的成果是TH—OCR 97综合集成汉字识别系统，它可以完成多文种(汉、英、日)印刷文本、联机手写汉字、脱机手写汉字和手写体数字的识别输入。几年来，除清华文通TH-OCR外，其它如尚书SH—OCR等各具风格的OCR软件也相继问世，中文和数字识别市场稳步扩大，用户遍布世界各地。近几年来国内对数字识别的研究还是相当深入的，也取得了很大成绩，使系统的识别率不断上升。目前，印刷体数字的识别率已达到99％以上，联机手写体数字的识别率已达到99%，但是脱机自由手写体数字的识别率只有90％，这显然不能满足社会的迫切需要，因为在很多应用系统中，一个数字的识别错误可能导致巨大的损失。因此对于脱机手写体数字的识别仍有待于进一步提高。

而随着计算机科学、心理学、人工智能等交叉学科的融合发展，以及市场需求的驱动，手写体数字识别技术将会取得更大的进展。手写体数字识别实用性很强，在大规模数据统计(如例行年检，人口普查)，财务，税务，邮件分拣等等应用领域中都有广阔的应用前景。手写体数字识别的研究不仅有很大的应用价值，而且有重要的理论价值，由于数字别的类别较小，有助于作深入分析及验证一些新的理论。例如人工神经网络，相当一部分的ANN 模型和算法都以手写数字识别作为具体的实验平台。可以说，手写体数字识别的研究将有助于模式识别、机器理解、机器人技术的发展，对今后研究如何更好地进行人机交互，使计算机具有和人一样的能力有很大的理论价值。

{title}

2. 研究的基本内容与方案

{title}

（一）设计（论文）主要内容及目标：
手写数字识别是多文本识别中的一个重要方面,其综合了数学图像处理、计算机图形学和人工智能等多方面的知识，已越来越成为计算机自动化和智能化的重要技术。由于手写数字的不规范性和多样性,再加上为了识别精确而对数字图像进行高点阵扫描，从而使数字识别时所要处理的信息不仅量大，而且复杂。为了能更好地识别,就要求识别系统能从大量数据中抽取关键信息，加以准确识别。
本设计以BP神经网络算法为核心,在相关图像预处理的基础上,构建了手写数字识别系统。该系统由三个模块组成,即图像采集模块、图像预处理模块和数字识别模块。首先通过图像采集模块完成图像的采集,并把采集到的数据以图片的形式保存,继而把图片送至图像预处理模块,图像预处理模块在对图像进行一系列变换和处理后,把最后提取到的特征提交给数字识别模块,数字识别模块再用神经网络技术对其进行识别并给出结果。

（二）完成的主要任务及要求：

1. 对给定手写数字串进行单个数字字符的分割与提取，完成适当的预处理。

2. 搭建BP神经网络，利用BP神经网络实现训练集的训练，使识别率达到预定要求。

3. 对提取的数字字符进行识别，根据识别结果不断改进BP神经网络。

3. 在Matlab 或 Python GUI中展示算法的实现过程。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码