图像字符识别方法研究文献综述

2020-04-15 16:52:14

1．目的及意义

人类社会的不断进步带来了信息空间的增长和积累，而计算机的出现为现代化信息处理提供了有效的手段。但是，在信息技术高速发展的同时，一个难题也摆在我们的面前，那就是计算机数据处理和网络传输的高速度与数据输入的低速度之间的矛盾。目前，许多文档是以纸质文档的形式存在，例如银行票据、税务报表、标准化考试中的机读卡、人口普查表、订货单等，纸质文档不便于保存、检索、统计和修改，而将这些信息录入计算机是一件非常繁琐的事情。长期以来人们通过键盘手工输入，不但费时费力且容易出错，这在一定的程度上减缓了社会信息化的进程。因而，作为信息化基础的数据输入成了计算机应用中的瓶颈问题。

人们接受信息最频繁的是视觉通道，在日常学习和生活中，所处理的信息有 75%-85%是视觉信息，其中文字信息愈来愈占重要地位。比如对各种期刊文献的阅读、查找、翻译，对各种统计报表的汇总、计算、分析，对各种函件票证的分拣、传送、验核等。要实现对这些文字信息处理过程的机械化、自动化，其先决条件就是利用计算机对这些文字信息进行识别。

图像识别技术是利用计算机视觉采集物理对象，以图像数据为基础，让机器模仿人类视觉，自动完成某些信息的处理功能，达到人类所具有的对视觉采集图像进行识别的能力，以代替人去完成图像分类及辨别的任务。而最早的文字识别始于50年代初期的欧美，1955年出现了印刷体数字OCR产品，此后转向手写体英文和数字的识别。对汉字识别研究最早的是美国IBM公司的Casey和Nagy 。1966年他们发表了第一篇关于汉字识别的文章，用模板匹配法识别1000个印刷体汉字，从此在世界范围内拉开了汉字识别研究的序幕。而手写体汉字识别的研究最早开始于70年代中期的日本。我国则在80年代初期开始进行手写体汉字识别的研究。

{title}

2. 研究的基本内容与方案

{title}

本系统开发工具选择Eclipse，使用Java作为语言进行开发，并用运用OpenCV和OCR环境。

OpenCV（Open Source Computer VisionLibrary）是一个跨平台的计算机视觉库，运用OpenCV对图像进行预处理。OCR（Optical Character Recognition）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程：即对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。

在系统中对图像的处理包括一下几个步骤：

预处理：对包含文字的图像进行处理以便后续进行特征提取、学习。这个过程的主要目的是减少图像中的无用信息，以便方便后面的处理。

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码