登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 外文翻译 > 理工学类 > 电气工程及其自动化 > 正文

通过概率性潜在变量模型进行过程数据分析外文翻译资料

 2023-07-12 10:07  

英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


附录A 译文

通过概率性潜在变量模型进行过程数据分析

摘要:降维对于过程工业中数据的高维性质非常重要,这使得潜变量建模方法在近年来很受欢迎。通过将高维数据投射到低维空间,潜变量模型能够从过程数据中提取关键信息,同时提高数据分析的效率。本文通过概率论的观点,对过程数据分析的概率潜变量模型进行了教程性的回顾,提供了各种基本概率潜变量模型(PLVM)的详细说明,以及它们的研究现状。此外,还介绍和讨论了这些基本的PLVMs在过程数据分析中的更多对应关系,对这一课题的未来研究提出了一些观点。

1 导言

随着分布式控制系统和新的测量设备的广泛使用,大量的数据在工业生产过程中被记录和收集,这使得数据分析在过去几年中很受欢迎。传统的建模方法与过程数据建模和分析相比,前者通常只包含了工程师以往的知识或经验,而后者则更加灵活,简而言之,数据模型的建立更加容易和快速。从过程数据中可以提取有价值的信息,然后将其结合到有效的知识,用于过程理解和决策依据[1-3]。例如,基于数据的模型已经被生产出来,用于在线过程监测和故障诊断,如果过程中有任何异常或故障发生,它可以提供过程运行状况的实时信息以及根本原因的定位[4-6];推理或软传感器已经从历史的过程数据中被制造出来,用于在线估计或预测关键指数和质量变量[7-8];数据聚类方法已被提出,用于操作模式的识别;数据驱动的分类模型已被研制出,用于各种数据模式的判别分析,如过程故障、生产等级、批次方式等等[9-12]

在过去的二十年里,有许多过程数据建模和分析方法的发现,其中潜变量模型发挥了重要作用[13-26]。由于过程数据的高维性质,降维是必要的,否则数据分析可能是相当困难的。因此,潜变量数据建模方法,如主成分分析(PCA)和部分最小二乘法(PLS)就在过程数据分析中变得非常广泛。通过将数据投射到低维空间,潜变量模型能够从数据中提取关键信息,同时提高数据分析程序的效率。例如PCA/PLS可以将过程数据的维度降低到二维或三维,在这种情况下,数据的可视化变得实际可用,过程的主要变化也可以被有效地监控。到目前为止,潜变量模型已被广泛用于过程数据监测、判别分析、回归建模、聚类、分类等。通常使用的潜变量模型包括PCA、PLS和独立成分分析(ICA)。最近,Bartolucci等人[27]从不同的角度讨论了潜变量模型在处理大数据复杂性方面的问题,如数据结构的简化、变量间依存性的灵活表示、减少选择偏差以及参数估计中涉及的问题。

然而,传统的潜变量模型缺乏对过程数据的概率性解释。事实上,几乎所有的过程变量都受到了随机的噪声污染。因此,过程变量在本质上是通过统计方式,而不是以确定的方式进行的。在这种情况下,最好使用概率模型结构,它为过程数据提供了一个更合理的表达。实际上,使用概率数据模型还有几个好处:首先,概率模型可以自然地处理数据集中的缺失值,这在实践中是非常实用的。第二,在概率模型的参数估计中,可以采用以往的期望最大化(EM)算法,这可以大大减少计算负担,尤其是对于高维工业过程数据。第三,为了处理更复杂的问题,将单一模型的结构推广到混合模型的情况下是比较直接的。此外,概率模型可以采用贝叶斯方法进行模型选择和参数调整,如此一来,在避免过拟合问题的同时还能充分利用建模的数据集。

在过去的几年里,各种潜在变量模型的概率形式被引入或新开发用于过程数据分析。例如,已经引入了概率PCA模型用于过程监控,后来又提出了该模型的监督形式,也称为概率PCR,用于软测量建模和在线质量预测。最近,一种概率形式的ICA模型已被引入非高斯过程建模和监测。独立潜在空间由学者的t公式指定,以同时考虑高斯和非高斯特征,而附加噪声项进一步作为解释潜在过程不确定性的补充。PLS模型的概率形式也被引入到过程数据回归建模中,并对混合形式进行了扩展,以解决更复杂的数据回归问题。此外,在这些基本的概率潜在变量模型的基础上,在过去的几年里,已经开发了各种对应的过程数据分析的性能改进。本文第2节将详细介绍与这些对应的资料。

2 用于过程数据分析的概率潜变量模型

本节阐述了不同种类的概率潜变量模型的主要思想和研究现状。重点介绍四种主要的概率潜变量模型,即概率PCA、因子分析、概率PLS和概率ICA,这些模型近年来在过程数据分析中运用相当广泛。本节还将简要介绍其他相关的概率潜在变量模型。此外,对不同方法进行了比较讨论,详细说明了这些方法在过程数据分析中的应用现状。

2.1 概率性PCA

作为基本PCA模型的概率对应,其概率形式是由Tipping和Bishop[28]首次提出的,它是基于生成模型结构,概率PCA方法的计算公式表述为

x = mu; Pt e (1)

其中, x isin; Rm代表过程变量,m是过程变量的数量,mu; isin; Rm包含过程变量的平均值,t isin; Rk是潜变量,k是潜变量的数量,P isin; Rmtimes;k是加权矩阵,e isin; Rm是方差为beta;-1的零均值白噪声项,因此p(e)=N(e|0,beta;-1 I)。在概率PCA模型中,潜变量t的先验分布被假定为标准高斯分布,所以p(t)=N(t|0,t)。基于模型结构的定义和潜变量的假设,过程变量x的条件概率可以确定为p(x | t) = N(x | t, Pt mu;, beta;-1I) 。从而得出x的边际似然函数可以通过整合潜变量来计算,给定为

p(x|P, beta;) = int; p(x|t, P, beta;)p(t)dt (2)

图1中提供了概率PCA模型的说明:

图1 概率PCA模型示意图

给定N个数据样本的数据集X = (x1, x2,hellip;hellip;,xn),P和beta;可以通过最大化以下似然函数来确定:

为此,EM算法可以提高计算效率。在E步骤中,潜在变量的统计量估计为:

lt;tn gt;= (beta;minus;1I PTP)minus;1PTxn (4)

lt;tntnTgt;=beta;minus;1(beta;minus;1I PTP)minus;1 lt;tngt;lt;tnTgt; (5)

但在M-步骤中,参数被更新为:

这两个参数的最优值可以在EM算法收敛时确定。

对于过程监控的应用,可以构造两个统计量T2和SPE来监控主操作区域和剩余空间的变化。对于一个新的过程数据样本xnew,应用概率PCA模型可以计算出估计的潜在变量,给定为:

tnew = Qxnew = PT(PPT beta;-1I)-1 xnew (8)

潜变量的估计方差为:

var(tnew) = Q(PPT beta;minus;1I)QT (9)

那么T2统计量可以表示为:

Tnew2 = tnewT(var(tnew))-1tnew (10)

另一方面,SPE统计量可以表示为:

SPEnew = enewT( beta;minus;1I)-1enew (11)

自从概率PCA模型被引入过程数据分析以来,越来越多的应用于过程工业中。例如,Chen和Liu[29]开发了一个混合主元分析网络,用于从过程数据中提取模糊规律;Kim和Lee[30]介绍了用于过程监测的概率PCA模型;Choi等人[31]制作了一个基于最大似然的混合主元分析模型,并将其用于故障检测;Thisen等人[32]提出了一个类似的用于多变量统计过程控制的混合潜变量模型;Chen和Sun[33]回顾了概率主主分析和混合概率主元分析模型的应用,讨论了一些实际问题,由此在过程监控中的应用提供了另一种视角。后来,Kariwala等人[34]提出了一种类似的分支定界法,通过缺失变量分析来隔离存在问题的变量。Yang等人[35]主张一种对齐的混合概率主成分分析,用于多模式化学过程的故障检测。Ge和Song[36]通过引入内核技巧将基本的概率PCA模型扩展到非线性形式,并将其用于工业过程的概率监测。He等人[37]提出了一种分支定界途径来构建基于重建的多变量贡献分析,用于故障隔离。Ge等人[38]制作了一种用于多模过程软传感的混合概率PCR模型,它实际上是混合概率PCA模型的监控装置。Zhou等人[39]提出了一个类似的用于过程质量监测的概率潜变量回归模型。近期,概率PCA模型被扩展为用于过程监测的稳固形式,它可以在建

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[604238],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图