配对标准化投票方法快速手写OCR分类外文翻译资料

2022-11-27 14:35:51

英语原文共 8 页，剩余内容已隐藏，支付完成后下载完整资料

配对标准化投票方法快速手写OCR分类

Juan Ramon Rico-Juan和Jose M. I〜nesta

西班牙阿利坎特E-03071阿拉斯加西班牙大学圣地亚哥信息研究所西班牙阿利坎特省

概要：在这项工作中，我们提出了基于相似欧几里德距离组合分类器决策的权重归一化方法。这种归一化投票方法可以用于减少OCR任务中的最终误差率。来自字符的差异特征被提取出来。每一组的特征是由一个单一的分类器加工处理后再使所有个人分类器的决定与采用中的加权投票和不同技术相结合。所获得的误差率比通过使用Freeman链码作为轮廓表示和字符串编辑距离作为相似性度量获得的错误率相当或略好，但复杂度和分类时间却明显有着显著降低。

1介绍

分类器的组合是最近广泛应用于分类方法的一种策略形式。目前有很多方法可以应用分类器的组合[1]。基于决策信息的方法，如[2]中所报告的那样，允许加权个体分类决策，以获得良好的分类性能。有一些作品是根据方法分类中的分类概率（根据贝叶斯理论）来确定分类，如[3]所述，提出了几种公式来估计这种概率，而在[4]中，作者提出了一种基于k的方法最近邻规则的方法。在这项工作中，我们详细介绍了相应的功能，个别分类器及其组合的细节，以便对孤立的手写字符进行分类。在第二部分中，我们将说明为描述人物形象而选择的特征。在第三部分中，显示了在广泛使用的孤立手写字符数据库中应用不同分类器时获得的结果。最后，我们提出一些结论和未来的工作。

2二进制图像特征提取

该特征提取的目的是获得与特定分类器一起使用的不同类型的特征。为了获得相关的信息，我们设计了一个相同图像的三种不同表示（如图1a）。其主要思想是总结了在表示所述字符形状成比例的正方形区域中的图像矩阵信息。第一步是将图像中的角色定位，并将感兴趣区域（ROI）提取为字符边界框。这个ROI是从下面提取的特征的地方。

2.1前景特点

位图图像的经典表示是具有黑色像素作为对象的最小部分（I [x，y] = 1）和白色像素作为背景（I [x，y] = 0）的矩阵）。

首先，形态滤波器[5]已被应用于校正图像的间隙和假点。因此，我们定义了用于表示字符ROI的平方子区域。每个子区域由前景像素的数量表示。如果前景像素属于不同的区域，则涉及的每个区域累积该像素的比例值，如图1b中的示例所示。该算法在下面详细描述，其中I [IXM，IYM]是具有IXMtimes;IYM维度的位图图像，并且R [RXM，RYM]是具有RXMtimes;RYM的黑色像素的比例总和的矩阵。

(a） (b)

图.1.（a）原始图像（b）在形态滤波器和具有每个子区域的黑色像素数（对象）的比例总和的2times;2区域之后的图像

2.2背景特点

用于提取背景特征的算法与[6]类似。该算法是基于为图像中的每个像素绘制的四个投影（上，下，左和右）。当这些投影中的任何一个触摸前景物体时，与该像素相关联的计数器以一个单位增加。这样，我们可以根据其计数器的值来区分背景像素的四个不同类别。此外，添加了第五类以提供更多信息：有两种情况在几何上是相似的，但从拓扑学的角度来看是完全不同的。背景像素可以被对象像素包围，然后投影将触摸它们，并且计数器将为4，但该像素可以属于隔离区域或实际开放区域。因此，如果像素位于孤立的背景区域，则我们的算法将值5分配给计数器。因此，将五个矩阵提取为特征，每个计数器值一个。这些矩阵的每个单元表示在相应图像子区域中具有该计数器值的像素数，如图2中的示例所示。

2.3轮廓特征

我们以参考文献[7]的方式提取使用4链节点编码每对相邻像素之间的链接的对象轮廓，然后再考虑链接的方向（参见图3作为示例）。我们提取四个矩阵，每个方向一个。以与之前的小节中类似的方式，这些矩阵的每个单元表示方向的每个区域的总和，如图3a中的示例所示。

图.2.背景特征

使用p ij = pij /pi;pij对所有这些区域进行归一化以获得更好的性能，其中pij是小区i，j表示该区域中的特征的比例总和。

2.4分类方案

根据不同的特征描述对三种算法进行了相对科学地比较：

1. 基于上述三组特征的个体分类器。使用的特征是基于图像的像素（图像）、背景的信息（背景）和图像的四个方向（方向）的。

2.基于确认投票方法的组合分类器[2]：

bull;混乱[8]：每一个分类器都给予一票一个对每个分类的信任。获得最高信誉的分类是最佳优胜者。

bull;总和规则：每个类别从每个分类中得出确认信息。积分最高的分类是获胜者。

bull;产品规则：等于总和规则，但产品用于获取每个类的最终确认信息。

单个分类器的结果是基于与训练集样本的欧氏距离。我们使用表达式的修改来计算基于[3]并在[4]中提出的后验概率。估计是P（omega;i| x），其中omega;i是第i类，x是分类的新例子。新估计的计算公式为

该估计基于最近邻样本。引入ε值，其为接近于0的正小值。允许应用该公式而没有过流错误。

3. 使用[9]（contour-string）中描述的8-Freeman码，将图像的轮廓作为字符串。

图.3.a）四个2D方向b）轮廓编码和一个2times;2矩阵，每个方向的像素数的总和

3结果

使用上述不同的轮廓描述，使用国家标准与技术研究所的NIST SPECIAL DATABASE 3进行分类任务来表示字符。只有26个大写手写字母被使用。实验的增加的培训样本由500个撰写者选择并选择样本。测试的大小在所有情况下为1300示例，而训练集的不同大小为1300,2600,3900和5200，对应于每班50,100,150和200个示例。

如图4所示，在试验的初步试验中，对各区域进行了测试。将ROI划分为6times;6子区域，误差率低于其他区域，计算时间最长。因此，计算SummatoryOfRegions函数的RXM和RYM参数固定为6times;6，以计算其余的实验。

已经测试了对分类综合体系结构的敏感性，从最终组合中去除了三个独立分类器之一，结果总是比三个分类器的组合差。

图 .4.用1300个测试例和5200个模型实例进行初步试用。 a）平均分类误差率b）平均分类时间。

图.5. a）平均分类误差率b）平均分类时间

如图5a所示，通过使用产品规则的分类器的组合获得最低误差率。无论如何，这个结果与基于总结规则和字串轮廓分类器的分类器组合的结果相当。在图5b中，显示了分类次数作为样本数的函数。像分类器的情况一样，时间远远低于使用轮廓链码，因为链码使用具有二次复杂度的字符串编辑距离，并且字符串的平均长度是每个字符350个码，而在提出的接近分类器使用一个更快的欧几里得距离。

4结论和未来工作

已经提出了一些从二值图像中提取形状特征的方法。每一组特征被用于基于欧几里德度量的不同分类器的手写字符识别。为了实现更好的效能，已经建立了这些分类器的加权投票式集合。提出了一种后验概率估计，以便在投票阶段对每个分类器提供的信息进行归一化，以降低最终的分类误差率。使用这些分类器组合的分类时间比使用轮廓链码的字符串编辑基于距离的分类器快约500倍，获得更好的错误率。这种组合将来将用于其他数据库，以探索该方法的鲁棒性以及它在其他数据的分类时间和错误率方面的表现。另外，在处理生物识别领域的其他数据时，我们将探讨其功能。

致谢由西班牙CICYT项目TIN2006-14932-C02支持的工作，部分得到欧盟ERDF和General Valatia I D i项目GV06 / 166项目的支持。

参考文献

1.L.I.Kuncheva.组合模式分类器：方法和算法.John Wiley＆Sons，2004.

2.Merijn van Erp，Louis Vuurpijl和Lambert Schomaker.模式识别投票方法的概述和比较.在IWFHR02：第八届手写识别边界国际研讨会论文集（IWFHR02），第195页，华盛顿特区，美国，2002年.IEEE计算机学会.

3.M.van Breukelen，D.M.J. Tax R.P.W. Duin和J.E. den Hartog.组合分类器的手写数字识别.计算语言学，34（4）：381-386,1998.

4. J. Arlandis，J.C.Perez-Cortes和J. Cano.对于ocr任务中k-nn分类器的拒绝策略和确认措施.十六号国际模式识别会议ICPR-2002，第1卷，第576-579页，Quebeq，（加拿大），2002年IEEE计算机学会.

5. J.Serra.图像分析和数学形态.学术出版社,1982年.

6.E.Vellasques，L.S. Oliveira ,Britto Jr.，A.L. Koerich和R. Sabourin.使用支持向量机建模分割切割.第十届手写记录前沿国际研讨会，第1卷，第41-46页，2006年.

7.秀田，朱碧兰，Junko Tokuno，Motoki Onuma，Akihito Kitadai，以及Nakagawa Masaki. 紧凑的在线和offline组合识别器.第十届手写记录前沿国际研讨会，第1卷，第133-138页，2006年.

8.O.G.Gridridge.混乱：思维过程机械化学习的范式。 In Proceedings of a Symposium held in the National Physical Laboratory，pages 513-526，London，November，1958. MIT Press。

J. R. Rico-Juan和L.Mico.为手写分类任务找到重要的点.在A.Campilho和M.Kamel编辑，国际图像分析与识别会议，3211计算机科学讲义笔记，第440-446页，葡萄牙波尔图，2004年6月，Springer.

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[26042]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码