通过概率性潜在变量模型进行过程数据分析外文翻译资料

2023-07-12 10:31:43

英语原文共 16 页，剩余内容已隐藏，支付完成后下载完整资料

附录A 译文

通过概率性潜在变量模型进行过程数据分析

摘要：降维对于过程工业中数据的高维性质非常重要，这使得潜变量建模方法在近年来很受欢迎。通过将高维数据投射到低维空间，潜变量模型能够从过程数据中提取关键信息，同时提高数据分析的效率。本文通过概率论的观点，对过程数据分析的概率潜变量模型进行了教程性的回顾，提供了各种基本概率潜变量模型（PLVM）的详细说明，以及它们的研究现状。此外，还介绍和讨论了这些基本的PLVMs在过程数据分析中的更多对应关系，对这一课题的未来研究提出了一些观点。

1 导言

随着分布式控制系统和新的测量设备的广泛使用，大量的数据在工业生产过程中被记录和收集，这使得数据分析在过去几年中很受欢迎。传统的建模方法与过程数据建模和分析相比，前者通常只包含了工程师以往的知识或经验，而后者则更加灵活，简而言之，数据模型的建立更加容易和快速。从过程数据中可以提取有价值的信息，然后将其结合到有效的知识，用于过程理解和决策依据^[1-3]。例如，基于数据的模型已经被生产出来，用于在线过程监测和故障诊断，如果过程中有任何异常或故障发生，它可以提供过程运行状况的实时信息以及根本原因的定位^[4-6]；推理或软传感器已经从历史的过程数据中被制造出来，用于在线估计或预测关键指数和质量变量^[7-8]；数据聚类方法已被提出，用于操作模式的识别；数据驱动的分类模型已被研制出，用于各种数据模式的判别分析，如过程故障、生产等级、批次方式等等^[9-12]。

在过去的二十年里，有许多过程数据建模和分析方法的发现，其中潜变量模型发挥了重要作用^[13-26]。由于过程数据的高维性质，降维是必要的，否则数据分析可能是相当困难的。因此，潜变量数据建模方法，如主成分分析（PCA）和部分最小二乘法（PLS）就在过程数据分析中变得非常广泛。通过将数据投射到低维空间，潜变量模型能够从数据中提取关键信息，同时提高数据分析程序的效率。例如PCA/PLS可以将过程数据的维度降低到二维或三维，在这种情况下，数据的可视化变得实际可用，过程的主要变化也可以被有效地监控。到目前为止，潜变量模型已被广泛用于过程数据监测、判别分析、回归建模、聚类、分类等。通常使用的潜变量模型包括PCA、PLS和独立成分分析（ICA）。最近，Bartolucci等人^[27]从不同的角度讨论了潜变量模型在处理大数据复杂性方面的问题，如数据结构的简化、变量间依存性的灵活表示、减少选择偏差以及参数估计中涉及的问题。

然而，传统的潜变量模型缺乏对过程数据的概率性解释。事实上，几乎所有的过程变量都受到了随机的噪声污染。因此，过程变量在本质上是通过统计方式，而不是以确定的方式进行的。在这种情况下，最好使用概率模型结构，它为过程数据提供了一个更合理的表达。实际上，使用概率数据模型还有几个好处：首先，概率模型可以自然地处理数据集中的缺失值，这在实践中是非常实用的。第二，在概率模型的参数估计中，可以采用以往的期望最大化（EM）算法，这可以大大减少计算负担，尤其是对于高维工业过程数据。第三，为了处理更复杂的问题，将单一模型的结构推广到混合模型的情况下是比较直接的。此外，概率模型可以采用贝叶斯方法进行模型选择和参数调整，如此一来，在避免过拟合问题的同时还能充分利用建模的数据集。

在过去的几年里，各种潜在变量模型的概率形式被引入或新开发用于过程数据分析。例如，已经引入了概率PCA模型用于过程监控，后来又提出了该模型的监督形式，也称为概率PCR，用于软测量建模和在线质量预测。最近，一种概率形式的ICA模型已被引入非高斯过程建模和监测。独立潜在空间由学者的t公式指定，以同时考虑高斯和非高斯特征，而附加噪声项进一步作为解释潜在过程不确定性的补充。PLS模型的概率形式也被引入到过程数据回归建模中，并对混合形式进行了扩展，以解决更复杂的数据回归问题。此外，在这些基本的概率潜在变量模型的基础上，在过去的几年里，已经开发了各种对应的过程数据分析的性能改进。本文第2节将详细介绍与这些对应的资料。

2 用于过程数据分析的概率潜变量模型

本节阐述了不同种类的概率潜变量模型的主要思想和研究现状。重点介绍四种主要的概率潜变量模型，即概率PCA、因子分析、概率PLS和概率ICA，这些模型近年来在过程数据分析中运用相当广泛。本节还将简要介绍其他相关的概率潜在变量模型。此外，对不同方法进行了比较讨论，详细说明了这些方法在过程数据分析中的应用现状。

2.1 概率性PCA

作为基本PCA模型的概率对应，其概率形式是由Tipping和Bishop^[28]首次提出的，它是基于生成模型结构，概率PCA方法的计算公式表述为

x = mu; Pt e (1)

其中， x isin; R^m代表过程变量，m是过程变量的数量，mu; isin; R^m包含过程变量的平均值，t isin; R^k是潜变量，k是潜变量的数量，P isin; R^mtimes;k是加权矩阵，e isin; R^m是方差为beta;-1的零均值白噪声项，因此p(e)=N(e|0，beta;^-1 I)。在概率PCA模型中，潜变量t的先验分布被假定为标准高斯分布，所以p(t)=N(t|0,t)。基于模型结构的定义和潜变量的假设，过程变量x的条件概率可以确定为p(x | t) = N(x | t, Pt mu;, beta;^-1I) 。从而得出x的边际似然函数可以通过整合潜变量来计算，给定为

p(x|P, beta;) = int; p(x|t, P, beta;)p(t)dt (2)

图1中提供了概率PCA模型的说明：

图1 概率PCA模型示意图

给定N个数据样本的数据集X = (x₁, x₂，hellip;hellip;，x_n)，P和beta;可以通过最大化以下似然函数来确定：

为此，EM算法可以提高计算效率。在E步骤中，潜在变量的统计量估计为：

lt;t_n gt;= (beta;minus;1I P^TP)^minus;1P^Tx_n (4)

lt;t_nt_n^Tgt;=beta;minus;1(beta;minus;1I P^TP)^minus;1 lt;t_ngt;lt;t_n^Tgt; (5)

但在M-步骤中，参数被更新为：

这两个参数的最优值可以在EM算法收敛时确定。

对于过程监控的应用，可以构造两个统计量T²和SPE来监控主操作区域和剩余空间的变化。对于一个新的过程数据样本x_new，应用概率PCA模型可以计算出估计的潜在变量，给定为：

t_new = Qx_new = P^T(PP^T beta;^-1I)^-1 x_new (8)

潜变量的估计方差为：

var(t_new) = Q(PP^T beta;minus;1I)Q^T (9)

那么T²统计量可以表示为：

T_new²= t_new^T(var(t_new))^-1t_new (10)

另一方面，SPE统计量可以表示为：

SPE_new = e_new^T( beta;minus;1I)^-1e_new (11)

自从概率PCA模型被引入过程数据分析以来，越来越多的应用于过程工业中。例如，Chen和Liu^[29]开发了一个混合主元分析网络，用于从过程数据中提取模糊规律；Kim和Lee^[30]介绍了用于过程监测的概率PCA模型；Choi等人^[31]制作了一个基于最大似然的混合主元分析模型，并将其用于故障检测；Thisen等人^[32]提出了一个类似的用于多变量统计过程控制的混合潜变量模型；Chen和Sun^[33]回顾了概率主主分析和混合概率主元分析模型的应用，讨论了一些实际问题，由此在过程监控中的应用提供了另一种视角。后来，Kariwala等人^[34]提出了一种类似的分支定界法，通过缺失变量分析来隔离存在问题的变量。Yang等人^[35]主张一种对齐的混合概率主成分分析，用于多模式化学过程的故障检测。Ge和Song^[36]通过引入内核技巧将基本的概率PCA模型扩展到非线性形式，并将其用于工业过程的概率监测。He等人^[37]提出了一种分支定界途径来构建基于重建的多变量贡献分析，用于故障隔离。Ge等人^[38]制作了一种用于多模过程软传感的混合概率PCR模型，它实际上是混合概率PCA模型的监控装置。Zhou等人^[39]提出了一个类似的用于过程质量监测的概率潜变量回归模型。近期，概率PCA模型被扩展为用于过程监测的稳固形式，它可以在建

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[604238]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码