基于深度学习的图像质量识别技术外文翻译资料

2022-08-13 15:43:18

英语原文共 8 页，剩余内容已隐藏，支付完成后下载完整资料

基于深度学习的图像质量识别技术

摘要

图像在当今社会中扮演着重要的角色，是重要的信息载体。然而, 由于在拍摄或处理过程中出现的问题，图像质量往往难以保证, 低质量的图像往往因为难以识别，而导致信息的浪费。如何有效地识别低质量图像已成为当今社会的一个研究热点。深度学习在图像识别中有很好的应用。本文将其应用于低质量图像的识别。为了有效地实现低质量的图像识别，研究了一种基于深度学习的图像质量识别技术。首先，在图像预处理阶段，提出了一种利用非线性变换增强图像对比度、恢复图像细节、提高图像质量的低质量图像增强方法。其次，利用卷积神经网络提取图像特征，并引入L2正则化方法对过拟合问题进行优化。最后，利用支持向量机（SVM）对卷积神经网络的输出进行识别，实现低质量的图像识别。通过仿真分析发现，在预处理阶段提出的图像增强方法可以有效地提高图像质量，而深度学习可以有效地实现对增强图像的识别，提高识别精度。

1.介绍

如今，随着科学技术的不断发展，相机、手机等设备越来越普及，图像也成为了重要的信息载体。然而，由于操作或环境问题，产生了越来越多的低质量图像，低质量图像信息的提取成为一个新的挑战。传统的方法如基于模板的匹配方法需要大量的先验知识，并且特征提取是基于人工设计的。这些方法不能满足现有的需求，不能很好地去处理那些低质量的图片。本文中，在研究了多种图像识别方法之后，我们发现了深度学习的优点，并决定使用该技术去识别低质量的图片。在图像识别的研究中，我们需要有效地提高低质量图像的图像质量。因此，图像处理技术在提高图像质量方面具有良好的应用前景。本文在图像处理技术的基础上，利用非线性变换增强图像对比度，很好地恢复了图像细节然后利用卷积神经网络提取图像特征，并引入dropout和L2正则化算法对过拟合问题进行优化。图片经过处理后，再利用支持向量机进行识别。

2016年，谷歌旗下的DeepMind公司开发的人工智能Alpha Go，以4:1的总分击败了世界围棋冠军李世石，基于深度学习的人工智能技术震惊了全世界。此后，深度学习和人工智能像风暴一样席卷了整个世界。此后，许多学者普遍认为，Alpha Go的出现标志着整个计算机领域的科技发展方向进入了人工智能的信息技术新时代，即IT新时代。在这个时代，大计算、大决策和大数据相互融合。如何利用深度学习来实现各个领域的人工智能，已经成为一个新的机遇和挑战。深度学习的本质是一个深度而复杂的神经网络[31–34]。该方法的核心原理是由Yuan Lecun等人在20世纪80年代和90年代提出的[9]。但是，由于神经网络规模大，训练时间长，相关硬件落后，它不可能计算出大量的数据。因此，人工神经网络的发展相对缓慢，主要停留在科研阶段。神经网络的深度相对较浅。大多数网络只包含两个全连通的隐藏层，这使得网络无法充分发挥其优势。直到本世纪初，许多学者才开始关注支持向量机、贝叶斯、随机森林分类器等分类器。2012年以来，NVIDIA公司生产的GPU成功应用于大型神经网络的并行计算，使得大量复杂数据集通过GPU集群在神经网络模型中进行训练，从而引发了神经网络的第二次革命。今天，深度学习在图像识别、自然语言处理(NLP)、语音识别等领域取得了突出的成果，并在许多学术和工程领域得到了广泛的应用。

虽然多层神经网络的概念是在20世纪80年代提出的，但由于其发展不成熟和硬件瓶颈，它的网络结构较小，主要由两个网络结构的隐含层组成。硬件瓶颈直接影响着网络性能的发展，因此在未来的20年里，无论是学术界的专家还是工程师都更倾向于采用只使用少量样本的SVM法和二分类方法. 随着高性能GPU集群的出现，它在并行计算方面具有独特的优势。该方法已应用于大型神经网络样本数据的训练，效果显著。因此，浅层网络性能瓶颈的弊端可以得到改变，这再次引起了研究者的关注。深度学习网络有两种，一种是以CNN网络为代表的监督学习网络，即卷积神经网络，又称前向神经网络。另一种则是半监督学习网络，主要包括以下几类: DBN (深度信念网络), RBM (受限玻尔兹曼机), 自动编码。随着计算机硬件的飞速发展，深度学习网络在MINST、CIFAR-10等大样本数据集的训练中充分体现了其优越的性能。主要原因是深度学习网络在网络层次加深时能够提取图像的深度抽象特征。例如，在卷积神经网络图像特征检测中，卷积运算可以提取浅轮廓特征，加深网络层次，也可以提取高级抽象特征，并根据神经网络的参数进行自适应调整，还可以解决复杂环境中合适的特征选择问题。因此，与浅层神经网络相比，深层网络具有更强的样本泛化能力。

在利用深度学习研究图像质量识别技术时，我们主要从图像预处理、特征提取和识别三个方面进行研究。

图像预处理主要是为了增强目标图像，减弱目标背景对识别的影响。它主要包括灰度处理、去噪、边缘检测和图像分割。常用的滤波方法可分为空间滤波和变换滤波，如Lee滤波、Frost滤波、域值滤波等。傅里叶变换滤波和小波变换滤波用于变换域滤波。此外，在边缘检测和图像分割方面也有不同的研究，它们都有重要的实现方法。这些预处理技术在图像细节恢复和图像质量增强方面具有良好的应用前景。合理的预处理可以保证图像质量，可以提高图像识别的准确性，在后续的特征提取和图像识别中起到很好的作用。

特征提取是对图像中有效信息进行提取和整合，将图像值转化为特征向量的过程。对于负性事件的识别，需要提取不同的特征，例如SAR幅值图像中的峰值特征和脊线特征。特征提取是研究如何从原始图像中提取更有效的特征,从而实现一个精确的图像和一定的特征向量或特征空间之间的映射关系,所以我们可以使用映射方法将原始图像的高维特征空间转化为低维空间的新特性。特征提取的质量和稳定性直接影响整个识别系统的性能。为了更好地适应环境光照、空间和尺度变化的影响，所选图像特征应具有可区分性、集中性和鲁棒性。该部分采用深度学习的方法提取图像特征，提取出有效的特征，提高了图像识别的准确性。

图像识别也是识别图像信息的最终目的。支持向量机在图像识别中有很好的应用。利用SVM对深度学习提取的特征进行分类。该方法在效率和精度上都优于传统的图像识别算法。

基于以上分析，本文采用深度学习的方法对图像质量识别技术进行研究，分别从预处理、特征提取和图像识别三个方面，采用不同的方法实现，从而形成了一种基于深度学习的图像质量识别技术。本文的具体贡献如下：

（1）在图像预处理阶段，提出了一种利用非线性变换增强图像对比度，恢复图像细节，提高图像质量的低质量图像增强方法。

（2）利用卷积神经网络提取图像特征，引入L2正则化方法优化过拟合问题。

（3）利用SVM对卷积神经网络的输出进行识别，实现低质量的图像识别。

2.拟采取的方法

2.1图像预处理

彩色图像包含R、G、B三个分量(或H、S、I等)，这些分量必须在图像处理中进行处理。实际上，在图像分割等领域中不需要复杂的颜色信息。灰度图像处理可以降低计算复杂度，减少复杂颜色对分割结果的干扰。常用的灰度法有极大值法。使R 、G和B的值等于这三个值中最大的，即。平均值法:使R、G、B的值等于计算出的平均值，即. 加权平均法:根据颜色组件的重要性,不同重量的R, G, B给出加权平均和,即。其中、、分别为R、G、B的权值。由于人眼的视觉敏感性，取 0:2989， 0:5870, 0:1140，最终得到如下灰色公式：

(1)

本文采用式(1)的加权平均法对图像进行处理，得到灰度图像。

中值滤波是一种比较普遍的空间非线性滤波方法，它不仅可以滤除图像中的噪声，还可以保留图像的边缘信息，因此在图像滤波中得到了广泛的应用。中值滤波的基本原理比较简单:设置一个滑动窗口，滑动窗口依次通过整幅图像，窗口中所有像素的中值作为中值滤波的输出。中值滤波器的窗口大小通常选择为奇值。窗口越小，过滤效果越差。窗口越大，噪声抑制能力越强。但是经过过滤的图像会变得模糊，所以选择合适的窗口大小是非常重要的。

针对传统的中值滤波算法在保护图像细节和抑制噪声方面存在的矛盾，提出了一种自适应中值滤波算法，该算法在保持图像边缘信息的同时，通过动态改变平滑窗口的大小来滤除噪声

自适应中值滤波主要在A级和B级进行变换:

Level A:如果 , 转换成 Level B, 然后增加窗口大小。如果窗口大小 ,仍然在Level A,输出。

Level B: 如果, 输出或。其中、和分别为图像中的最小值、中值和最大值。为(x，y)中图像的像素值，为图像的最大允许尺寸。

图像增强算法的基本功能是提高图像的可解释性或增强人类视觉的可感知信息 [16–18]. 在这个过程中，属性的选择和修改的方式取决于特定任务的需要。此外，由于观察者自身的特殊因素，如人的视觉系统和观察者的经验等，使得图像增强算法的选择具有很强的主观性。为特定的任务选择合适的方法是非常重要的。许多算法可以增强数字图像而不破坏它们。图像增强算法的技术手段基本上可以分为两类:空间图像增强算法和频率图像增强算法。像增强的目的是改变图像像素值的亮度、对比度和分布。最终的输出图像像素值将根据应用于输入图像的转换函数而改变。常用的图像增强算法有:引导图滤波算法（GIF）,多尺度视网膜增强算法 (MSR), 和带色彩恢复的多尺度视网膜增强算法(MSRCR)。

为了消除距离环境等因素对图像识别的影响，提出了一种基于伽玛变换和对数变换的非线性图像增强算法。改进后的算法消除了光照对图像的影响，恢复了图像的细节，提高了图像的视觉效果和识别精度。具体流程图如下：

1. 输入图像 I;

2. 对图像的通道进行分割，计算任意通道的S像素的最大值和最小值，即：

3.对通道图像进行如下非线性变换：

(2)

这种变换类似于伽马变换，但不等于伽马变换。当时，这种变换不会改变图像，即变换后的输出图像仍然是输入图像。当时，这种变换可以拉伸或抑制图像的像素值，增加图像的对比度，恢复由于距离等因素造成的高频分量的丢失，如边缘信息。当，可以拉伸低像素值的范围，抑制高像素值的范围。在这种情况下，可以增加图像中较暗区域的局部对比度，在一定程度上改善较暗区域对图像的影响，可以有效地恢复图像中较暗区域的细节。当时，可以扩展高像素值的范围来抑制低像素值。在这种情况下，可以增加图像中较亮区域的局部对比度，有效地恢复图像中较亮区域的细节。所以我们可以根据要增强的图像的情况来选择gamma;值。当光线较暗时，图像像素值会降低。在这种情况下，可以适当地降低gamma;值。相反，当光线较亮时，c值可以适当增加。实验表明，对于大多数图像都是合适的。

虽然这种变换可以在一定程度上消除光线对图像质量的影响，但是通过增加部分区域的对比度，抑制图像其他部分像素的范围，并不能有效的提高整个图像的对比度。

4. 对图像进行对数变换，如公式所示：

(3)

这种变换可以进一步拉伸图像的低像素值范围，增加暗图像的对比度，从而更好地恢复暗图像的细节，更适合户外较暗的情况。然而，对数变换大大抑制了高像素值，大大降低了图像的亮度。为了弥补这种情况，在对数变换之前给图像增加一个常量值，可以在一定程度上提高图像的亮度。

5. 将图像归一化，使其像素值在0到255之间。具体的转换如下：

(4)

2.2卷积神经网络的特征提取

卷积网络是卷积层、池化层和非线性映射等一系列结构的总和。它接受二维图像作为输入。卷积网络通过卷积、池化、非线性映射等一系列操作，可以在二维数据中发现复杂的模式，并将原始的二维图像数据表达为更抽象、更高层次的特征。

1. 卷积层

卷积层的作用是提取图像特征。在数学上，这种操作是通过离线卷积来实现的，这就是卷积神经网络的名称。在卷积层中，卷积图像是一个特征图，卷积运算涉及的滤波器是一个卷积核。

在卷积的过程中，为了提取多个有限元数据，需要使用多个不同的卷积核，每一层需要使用多个卷积核。在卷积核的初始化过程中，只需要指定卷积核的数目和大小，而不需要指定滤波器权值的具体数值。初始化后，卷积网络通过后续的学习算法来学习合适的值，即卷积核的权值。通过足够的卷积层，卷积网络可以表达图像。具体地说,例如,在第一层,表达哪部分是特定方向或位置的“边缘”,在第二层,通过检测模式是边缘的特殊安排,并在随后的层,发现模式相结合,形成一个更大的模式,而在层越高,物体组成的这些模式将被检测到。此特征提取中的特征独立于人类工程师的定义或设计。

2.池化层

池化层结合了语义特征，使特征的表达更加稳健。

在卷积网络中，高阶特征与低阶特征相结合。局部边缘组合形成线，线组合形成区域，而局部组合形成对象。卷积层检测上层特征的局部连接，而池化层在语义上合并相似的特征。池化层不需要训练或学习，只需要对卷积层的卷积特征图进行降采样即可。

由于形成相同主题的特征的相对位置不同，因此必须通过对每个特征位置的粗粒度检测来进行可靠的主题检测。当当前层中的元素位置改变时，池化操作提高了特性表达的稳健性。

最大池化元素是通过计算局部块的最大值来计算的。当计算完成前一个单元时，将移动某个行或列来计算下一个单元。池化的目的是减小表达式的维数，提高对平移和失真的鲁棒性，降低上层的计算复杂度。

此外，在现有的网络中，平均池化被设计来代替整个连接层，从而减少了网络工作参数。与最大池化操作类似，均值池化操作的计算方法是计算局部块的均值，并在计算最后一个单元格和计算下一个单元格后移动某些行或列。

3.激活函数

激活函数将输入映射到某个固定的函数。在卷积网络中，这个输入是每个单元通过卷积核的权值连接到上一个特征图的局部块的加权和。传统的神经网络通常使用平滑的非线性函数作为激活

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[236047]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码