基于概率神经网络的植物叶片识别算法外文翻译资料

2022-12-06 15:33:12

英语原文共 6 页，剩余内容已隐藏，支付完成后下载完整资料

基于概率神经网络的植物叶片识别算法

摘要：本文采用概率神经网络与图像和数据处理技术相结合，实现了通用的自动叶片识别。对叶片的12种特征进行提取并正交化为5个主体，由PNN的输入向量组成变量。PNN是由1800叶片训练，用来对32种植物分类，准确度大于90％。与其他方法相比，我们的算法是一种精确的人工智能方法，执行速度快且易于实施。

关键字：概率神经网络；特征提取；叶片识别；植物分类。

1介绍

植物遍布我们生活的地方，以及我们不在的地方。他们为开发者提供重要的信息，对人类社会产生有意义的影响。然而情况紧急的是植物有濒临灭绝的危险。所以建立植物保护数据库是非常必要的[1] - [4]。我们认为第一步是教计算机如何分类植物。

与其他方法相比，如细胞和分子生物学方法，基于叶图像的分类是更好的选择。采样并留下照片是成本低廉和方便的。人们可以很容易地将叶子图像传送到计算机，并且计算机可以在图像处理技术中自动提取特征。

一些系统使用植物学家使用的描述[5] - [8]。但要将这些功能自动提取并传输到计算机并不容易。本文试图防止人为干扰特征提取。

关于如何提取或测量叶子特征也是一个长期讨论的主题[9] - [15]。这使得在这个领域模式识别的应用成为一个新的挑战[1] [16]。根据杜等人[1]，计算机自动生成的植物数据采集尚未实施。

其他几种方法使用了他们的预定义功能。苗等人提出了一种基于证据理论的玫瑰分类[3]，涉及玫瑰的许多特征。顾等人尝试使用骨架分割的小波变换和高斯插值[17]。Wang等人使用了移动中位数中心（MMC）超球分类器[18]。 Du等人提出了类似的方法[1]。他们的另一篇论文提出了一种改进的叶形匹配动态规划算法[19]。Ye等人比较了植物分类特征之间的相似性[2]。

上面的许多方法采用k-最近邻（kNN）分类器[1] [17] [18]，而一些论文采用人工神经网络（ANN）。 Saitoh等人结合花和叶信息来分类野生植物[20]。Heymans等人提出了ANN的应用来分类仙人掌物种[21]。杜等人引入了一种基于径向基概率神经网络的形状识别方法，该方法通过正交最小二乘算法（OLSA）训练并通过递归OLSA进行优化[22]。它通过修改叶子形状的傅立叶描述符来进行植物识别。

以前的工作有一些缺点。有些仅适用于某些物种[3] [16] [21]。作为专家系统，一些方法比较了特征之间的相似性[2] [8]。它需要人工进行预处理才能手动输入密钥。提取植物学家使用的特征的方法也会出现这个问题[7] [16]。

在所有方法中，ANN对分类工作的速度最快，准确度最高。[22]表明，ANN分类器（MLPN，BPNN，RBFNN和RBPNN）比k-NN（k = 1,4）和MMC超球体分类器运行得更快，而ANN分类器提高其他分类器的准确度。所以我们采用人工神经网络作为我们的分类器。

本文使用易于提取的特征和高效的识别算法实现叶识别算法。我们的主要改进是特征提取和分类器。所有功能均从数字叶片图像中提取。只有一个例外，所有功能都可以自动提取。主成分分析（PCA）[12]将12个特征正交化。至于分类器，我们使用PNN [24]，因为它的速度快，结构简单。整个算法在通用方法中易于实现。

本文的其余部分安排如下。第二部分讨论了图像预处理。第三部分介绍了如何提取12个叶子特征。第四部对PCA和PNN进行讨论。第五部分给出实验结果。第六部分介绍了改进我们算法的未来工作。第七部分总结本文。

2图像预处理

2.1将RGB图像转换为二值化图像

叶子图像由扫描仪或数码相机采集。由于我们没有找到任何数字化设备以无损压缩格式保存图像，因此这里的图像格式为JPEG。所有的叶子图像都是800 x 600分辨率。拍摄时，叶片方向没有限制。RGB图像首先被转换成灰度图像。公式（1）是用于将像素的RGB值转换为其灰度值的公式。

gray = 0 . 2989*R 0 . 5870*G 0 . 1140*B （1）

其中R，G，B分别对应像素的颜色。

根据RGB直方图确定将灰度转换为二进制图像的级别。我们累积像素值，分别为R，G，B分别处理3000个树叶，并将它们除以树叶的数量3000。如图2所示为3000张叶子图像的RGB平均直方图。

每种颜色的直方图都有两个峰值。左峰是指由叶片组成的像素，而右峰是指由白色背景组成的像素。两个峰值之间的最低点在平均值的242附近。所以我们选择阈值为0.95（242/255 = 0.949）。输出图像将亮度大于阈值的输入图像中的所有像素替换为值1，并将所有其他像素替换为值0。

应用尺寸为3times;3的矩形平均滤波器滤除噪音。然后像素值被舍入为0或1。

2.2边界增强

当提及叶子形状时，头脑中出现的第一件事可能是叶子的边缘。将图像与以下3times;3空间的拉普拉斯滤波器相比较。我们可以得到叶子图像的边缘。

图3说明了一个图像预处理的例子。为了使边界在白色背景上成为黑色曲线，像素的“0”“1”值被交换。

3特征提取

本文从12个常用的数字形态特征（DMFs）中提取5个基本特征，使计算机能够快速自动地获取特征值（只有一个例外）。

3.1基本的几何特征

首先，我们获得5个基本的几何特征。

直径：直径被定义为叶边上任意两点之间的最长距离。它表示为D。
生理长度：我们算法唯一的人为干扰部分是您需要通过鼠标点击来标记叶片主静脉的两个终端。两个终端之间的距离被定义为生理长度。它表示为Lp。
生理宽度：绘制穿过主静脉两端的线，可以绘制与该线正交的有限线。这些线与叶边之间的交点对数量也是有限的。这些交叉点对之间的最长距离定义为生理宽度。它表示为Wp。由于像素的坐标是离散的，我们认为如果插入度为90°plusmn;0.5°，则两条线是正交的。生理长度与生理宽度之间的关系如图4所示。
叶片面积：叶片面积的值很容易评估，只需计算平滑叶图像上二进制值1的像素数。它表示为A。
叶周长：表示为P，通过计算包含叶缘的像素数来计算叶周长。

3.2十二个数字形态特征

根据之前介绍的5个基本特征，我们可以定义12个用于叶识别的数字形态特征。

平滑因子：我们利用噪声对图像区域的影响来描述叶子图像的平滑度。在本文中，平滑因子被定义为5times;5矩形平均滤波器平滑的叶子图像面积与2times;2矩形平均滤波器平滑的面积之间的比率。
纵横比：纵横比定义为生理长度Lp与生理宽度Wp的比值，即Lp/Wp。
形状因子：该特征用于描述叶子和圆形之间的差异。它定义为，其中A是叶面积，P是叶边的周长。
矩形：矩形描述叶子和矩形之间的相似性。它定义为LpWp/A，其中Lp是生理长度，Wp是生理宽度，A是叶面积。
狭窄因子：狭窄因子被定义为直径D与生理长度Lp的比率，因此D/Lp。
直径的周长比率：周长与直径的比率，代表叶周长P与叶子直径D之比，由P/D计算。
生理长度与生理宽度的周长比：该特征定义为叶周长P与生理长度Lp和生理宽度Wp之和的比值，即P/（Lp Wp）。
静脉特征：我们在灰度图像上进行形态学开放[25]，采用半径为1,2,3,4的圆盘形结构元素，减去残留的图像。结果看起来像静脉。这就是为什么以下5个特征被称为静脉特征。左侧像素的区域分别被表示为Av1，Av2，Av3和Av4。然后我们获得最后5个特征：Av1/A，Av2/A，Av3/A，Av4/A，Av4/Av1。

现在我们完成了特征获取的步骤并进入数据分析阶段。

4拟议方案

4.1主成分分析（PCA）

为了减少神经网络输入向量的维数，使用PCA对12个特征进行正交化。PCA的目的是将原始数据的信息表示为某些线性无关变量的线性组合。在数学上，PCA将数据转换为新的坐标系统，使得数据的任何投影的最大差异来自于第一坐标，第二最大方差来自第二坐标，依此类推。每个坐标称为主要组件。

在本文中，前5个主要组成部分的贡献率为93.6％。为了平衡计算复杂性和准确性，我们采用5个主要组件。

在使用我们的算法时，可以使用映射f：R12→R5来获取新坐标系中组件的值。

4.2概率神经网络简介

人工神经网络（ANN）是一组相互联系的人工神经元，模拟人脑的思维过程。人们可以将ANN看作是一个“神奇”的黑盒子，通过训练实现预期的智能处理，对照输入和输出信息流。因此，不需要关于如何识别不同植物的特定算法。PNN来源于径向基函数（RBF）网络，该网络是使用RBF的ANN。RBF是一种钟形函数，可非线性地对变量进行缩放。

采用PNN具有许多优点[26]。它的训练速度比BP网络快很多倍。在某些容易满足的条件下，PNN可以接近贝叶斯最优结果[24]。此外，它对噪声示例也很有效。我们选择它也是因为它简单的结构和训练方式。

PNN最重要的优点是训练简单且瞬时[24]。重量不是“受过训练”的，而是分配的。现有的权重永远不会交替，但训练时只有新的向量插入权重矩阵。所以它可以被实时使用。由于训练和运行过程可以通过矩阵处理来实现，因此PNN速度非常快。

网络类将向量输入到特定的类中，因为该类具有最大的可能性是正确的。在本文中，PNN有三层：输入层，径向基层和竞争层。径向基层评估输入矢量与权重矩阵中的行权重矢量之间的矢量距离。这些距离通过径向基函数非线性缩放。然后，竞争层找出它们之间的最短距离，从而找出最接近输入模式的训练模式。

4.3网络结构

我们的设计方案中的网络结构如图5所示。我们采用神经网络设计[27]中使用的符号和符号。这些符号和符号也被MATLAB神经网络工具箱[28]使用。阵列的尺寸标有其名称。

输入层：输入向量，记为p，表示为图5中的黑色垂直条。其尺寸为Rtimes;1。在本文中，R = 5。
径向基层：在径向基层中，计算输入向量p与由每行权重矩阵W构成的权向量之间的向量距离。这里，矢量距离被定义为两个向量之间的点积[29]。假设W的尺寸是Qtimes;R。p和第i行W之间的点积产生距离向量矩阵的第i个元素，记为|| W - p ||。其尺寸为Qtimes;1，如图5所示。负号表示“ - ”，表示它是矢量之间的距离。然后，偏向量b与||结合 W - p || 通过逐元相乘，在图5中表示为“·*”。结果表示为n = || W - p ||·* p。PNN中的传递函数已经建立在相对于中心的距离标准中。
径向基层的一些特征：如果输入p与输入权重矩阵W的第i行相同，则a的第i个元素等于1。具有接近输入向量p的权重向量的径向基神经元产生接近1的值，然后其在竞争层中的输出权重将其值传递给后面将讨论的竞争函数。由于输入模式接近几种训练模式，所以a的几个元素也可能接近于1。
竞争层：竞争层没有偏见。在竞争层中，向量a首先乘以层权重矩阵M，产生输出向量d。在图5中表示为C的竞争函数产生对应于d的最大元素的1，并在其他地方产生0。竞争函数的输出向量表示为c。 c中的索引1是我们的系统可以分类的工厂数量。它可以作为索引来寻找这个植物的科学名称。本文中输出矢量维数K为32。

4.4网络训练

对1800个纯净的叶子进行采样以训练这个网络。这些叶子在南京大学校园和中国南京的孙中山树木园采样。其中大部分是中国长江三角洲的常见植物。表1给出了不同植物叶片数量的详细情况。我们将不同植物叶片取样到不同植物的原因是植物样品叶片的难易程度不同。

径向基层权重：W被设置为Q个训练向量的Rtimes;Q矩阵的转置。 W的每一行由一个训练样本的5个主要变量组成。由于1800个样本用于训练，本文中Q = 1800。
径向基础层偏向：径向基础上的所有偏向层设置为导致径向基函数在plusmn;s的加权输入处交叉0.5。s被称为传播 PNN常数。s的值不能任意选择。每个神经元在径向基础层将有0.5或更多的响应任何输入矢量在距离它们的权重的矢量距离内向量。太小的s值可能会导致解决方案出现问题不是从设计中使用的输入/目标向量进行推广。相反，如果扩散常数足够大，径向基础神经元将输出大数值（接近1.0）用于设计网络的输入。
竞争层权重：M设为Ktimes;Q矩阵 Q目标类向量。目标类向量被转换来自对应于输入向量的类别索引。这个流程生成一个向量的稀疏矩阵，每个中有一个1 列，如指数所示。例如，如果训练集中的第i个样本是第j种植物，那么我们有在第i列的第j行是1。

表1.关于不同类型植物的叶数的详细信息

通用名称	训练样本	错误识别的次数
短柔毛竹	58	0
中国七叶树	63	0
安徽小檗	58	0
中国紫荆	72	0
真靛蓝	72	0 lt; 剩余内容已隐藏，支付完成后下载完整资料资料编号：[21324]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码