解开时间序列之间的因果关系外文翻译资料

2022-11-26 20:02:18

英语原文共 12 页，剩余内容已隐藏，支付完成后下载完整资料

解开时间序列之间的因果关系

摘要：给定两个时间序列，能否以一种严格和定量的方式表达出他们之间的因果关系？基于最近严格的物理概念，即信息流，我们解决一个反问题，并给出这个重要和具有挑战性的问题，这个问题的答案能广泛应用于各种学科。这里的因果关系通过从一个系列到另一个系列的信息的时间速率来测量。所得公式在形式上是紧密的，仅涉及常用的统计量，即样本协方差;一个直接推论是因果关系意味着相关性，但相关性并不意味着因果关系。它已经被验证与测试线性和非线性系列，据称是生成的单向因果关系，非传统的方法。它也已成功应用于现实世界问题的调查;这里提出的一个例子是两种气候模式（El Nino和印度洋偶极子（IOD））之间的因果关系，它们与全球广泛地区的气象灾害有关。一般来说，两种模式是互为因果的，但因果关系是不对称的：El Nino倾向于稳定IOD，而IOD则使El Nino更不确定。对于厄尔尼诺，来自IOD的信息表现为来自印度洋的不确定性的传播。

I.引言

在哲学讨论中，Dempster说“因果分析能指引更好的理解”。事实上，识别动力学事件之间的因果关系是一个在各种学科都非常有用的课题。在神经科学，生物学，动力，金融经济学，地球科学和物理学中都存在例子。在本研究结束时，我们将看到一个与气候科学中与严重的天气和自然灾害相关的例子。

通常考虑到讨论的两个事件的已知是时间序列的形式，因此时间序列之间的因果关系分析是特别重要的。然而，这是一个非常困难的问题;事实上，是数据科学中的“最大挑战之一”。目前，一种常见的做法，特别是气候科学中的做法，是计算时间滞后的相关性。然而，众所周知，相关性不携带所需的定向性或不对称性，并且已知的不一定意味着因果性。正如巴纳德所指出的：“这种相关性不是因果关系。”除此之外，人们可能会认为，对于周期性的流程，实际上没有办法区分滞后与提前，除非有足够的先验知识关注的过程。过程是不连续的时候，问题就很特别了，具有循环的原因和结果容易导致“鸡-蛋困境”。

另一种做法是执行Granger因果关系检验，这是一个时间序列在预测另一个时间序列中有用性的统计检验。这种测试，顾名思义，只做出是或否判断，缺乏在许多情况下可能需要的定量信息。为了纠正这种缺陷，最近人们开始了将目光转向经验信息理论的措施，即转移熵。不幸的是，这种措施是众所周知的难以评价，需要长时间的数列统计，这是对计算的挑战。此外，最近的研究表明，它是有偏差的，因为它的值取决于对动力系统中的自动依赖系数。也许这就是为什么在许多应用科学中，特别是气候科学，时间延迟相关分析仍然是主要工具。

在这项研究中，我们将显示因果关系分析可以严格制定和量化实现，结果得到的公式非常简洁和容易计算。考虑到气候科学等众多科学领域的大量相关研究，本研究预计将提供及时的帮助。

我们使用信息流或信息传递正如文献中提及的，以测量动态事件之间的因果关系。它一直被认为是适当的因果关系的测度，作为信息量两个事件之间的交换不仅指示了数量，而且指示了因果关系的方向。由于其重要性，过去几十年来出现了越来越多的人对制定这个概念产生了兴趣。形式已经根据经验或半经验建立，其中之一是上述所说的转移熵。实现这些信息流动是一个真实的物理概念，而一个真实的物理概念应该严格，而不是凭经验，建立在一个坚实基础上，以便普遍适用于不同学科的问题，梁和克莱曼建立并进行一系列研究，一个就给定的信息流动力系统所建立的形式，既有确定性又有随机性。问题是它依赖于给定的动力系统，因此样本中的所有或部分信息空间存在因果关系（但是动力或规律本身没有因果关系）。但是，我们在这里只是两次时间序列，即，用于二维（2D）系统。如果我们把它称为“前向问题”，那么我们需要研究的是一个“逆问题”，即能否以及如何在没有动力的情况下根据先前给出的两个时间序列实现相同的概念; 这样，将获得系列之间的定量因果关系，这可能具有一定的难度。这项研究表明确实可以获得这样一个预期并具有深远影响的公式。

在下面，我们首先简单地介绍“前向问题”。主要推导见第三节，在那一节得到一个简明的因果关系公式。这个公式被验证与标准时间序列之间有单向的因果关系（第四节），然后将其应用于El Nino和印度洋偶极子（IOD）这两个气候变化的主要模式之间的因果关系的研究，有一个结果被证明多年但在以前使用现有工具的观察性数据分析中遗漏了（第五节）。这项研究将在第六章讨论，第七章进行总结。

II．“前向问题”

在进入“逆问题”之前，让我们简要回顾一下“远期问题”，即最近建立的信息流动形式与动态。

考虑一个d维的随机系统

d X =F(X;theta;)dt B(X;theta;)d W （1）

其中F是漂移系数的向量，theta;是向量参数，B =（bij）扩散系数矩阵（或者说法中的波动率），W是标准维纳过程的向量（是所谓的白噪声）。

通常，矢量场F假定是可微分的。信息的速率从一个分量，例如X2，到另一个，例如X1，是X1的基本熵的变化率，减去相同的变化率，但受到从系统瞬时排除的X2的影响。对于任何给定的动力系统，这些信息流或转移率都是以封闭形式分析得出的。推导过程是漫长的，而且涉及技术上的一些问题，需要例如一些Frobenius-Perron算子的评估和为排除X2的系统建立一种Fokker-Planck方程。但结果似乎是易处理。特别地，对于我们将在本研究中考虑的维度2（2D）的系统，我们有以下定理。

定理II.1：对于系统（1），如果d = 2，则从X2到X1的流量的速率为

（2）

其中rho;1是X1的边际概率密度，E是数学期望值。

证据参考参考文献[16]，同样的定理，T2→1可以是零或非零。非零T2→1意味着X2是X1的因果：正值意味着X2使得X1更不确定，反之亦然。这种信息流量测度的重要性质，即因果性或流动性或转移不对称性的性质：单向信息流不涉及相反方向的流动。特别是，我们有以下证明的事实：

定理II.2 对于系统（1），如果X1的演变不依赖于X2，则从X2到X1的信息流消失，即T2→1 = 0。特别地，如果向量域分量F1独立于x2

如果独立于x2，那么

III.基本分析

上述信息流的结果是严格的。然而，这不是因果关系分析，因为在给定的动力系统中，因果关系存在部分规定，尽管这些规定本身并不意味着因果关系。因为可以从动态系统可以产生一个类似的实现，这种形式是基于无限多的实现的。然而在这项研究中，唯一已知的是两个时间序列，即一个实现，我们需要找到相应的信息流，这可能是非常具有挑战性的。

在等式中，如果最初（X1，X2）具有双变量高斯分布，则系统是线性的，密度总是高斯分布。表示平均值，协方差矩阵为，其中。他们按照微分方程演变为

（3a）

（3b）

X1和X2之间的信息流现在很容易评估。我们只需要考虑T2→1。(I)(II)表示r.h.s(2),并写入替换beta;。

(I)=

(II)=

前者是参考文献[13]中的定理。（II）实际上是Ref [16]证明的因果关系的特殊情况：当beta;独立于x2，（II）= 0。在流动的不对称性中反映了因果关系。在（I）中，它与一起。为了理解（II）中不对称性的出现，我们假定beta;是x2的线性函数：。如上所示，beta;0对T2→1无贡献; 我们只需要看看kx2的贡献。通常这不能明确找到; 人们必须解决密度演化方程，然后评估（2）。为了解释，让我们假设密度也是高斯（当然这通常不是真的）。于是有了这个，

(II) =

= （4）

= （5）

这在X1和X2之间显然是不对称的。我们处理因果问题的策略首先是估计线性模型，即估计参数(f，A，B），然后计算信息流。在不失一般性的情况下，假设时间序列相等。我们使用最大似然估计（MLE）来满足目的。随着协方差sigma;ij（i，j = 1,2）可以通过相应的样本协方差相当精确地估计，我们关注于a12的估计。考虑一个间隔[n△t，（n 1）△t] 时间步长。如果可以获得转移概率密度函数rho;（Xn 1 | Xn;theta;），则{Xn}是马尔可夫过程的可能性为

N为样本大小，或者替代的记录可能性为

当N大时，可以舍去rho;（X1），而不会产生很大的误差。在这种线性情况下，可以发现rho;的解析解; 然而，结果是复杂的。为了实际应用，我们转向SDE的离散版本。使用欧拉 - 伯恩斯坦方法，

其中F=f Ax

假设△t很小

（6）

这里注意，我们假设N足够大，使得rho;（X1）可以被舍弃而不会引起很大的误差。因此，，的MLE是使最大化的。

为方便起见，对于i = 1,2，

（7）

（8）

注意到.带入式（6）中，可以得到

可以通过使最大化来找到f，A和B的估计。有趣的是，控制估计器(），()和()的方程实际上是去耦的，这使得估计更容易。另外，注意到最大化（）等效于使i = 1,2的相同参数组中的最小化。所以（）正是最小二乘估计量，满足于

上面的方程组可以写得比较熟悉和简洁的形式

像往常一样，上线表示样本的意思。让

C=() 作为样本协方差矩阵。很容易显示

为了找出剩余参数，令

（9）

其中

另一方面，由于可以通过样本协方差矩阵来估计协方差矩阵，所以我们估计/可以用/代替

将这些结果代入（2）的线性版本，,我们最终可以得到从到的信息流（10）

其中Cij是Xi和Xj之间的样本协方差，是Xi和X j之间的协方差。严格来说，这里T2→1应该有一个插入符，因为它是真实信息流的估计。但是为了简洁，我们会使用一些符号。相反方向T1→2的流量可以通过切换指标1和2直接写出。单位为单位时间的数量。

给定一个显著水平，我们可以估计（4）的确定间隔。这实际上可以始终使用引导来实现。但是这里可以简化。当N大时，由于具有MLE特性，T2→1近似正态分布在其真值附近，方差.的定义如下（参考文献[18]）

给定,计算

以形成矩阵NI，I是费舍尔信息矩阵。NI的逆矩阵是的协方差矩阵。给定一个显著水平，确定间隔可以相应地找到。由于关于相关性与因果关系的争论很大，因此在相关性和/或相关性数量方面写（10）可能是有意义的。令作为样本相关系数，作为与之间的相关性，但是用其方差归一化，我们可以得到

（11）

显然，两个不相关的事件（r = 0）必须是非因果关系（T2→1 = 0）; 换句话说，因果关系意味着相关性。然而，相反则不符合; 即相关性并不意味着因果关系。

IV．验证

线性问题

为了验证（10），考虑二维随机微分方程（SDE）集

（12a）

（12b）

显然，X2驱动X1，反之亦然。这种问题在因果分析中是非常典型的：一个因素导致另一个因素，但后者对前者没有反馈意见。我们现在生成一个样本路径（，），并期望从唯一的实现恢复这个单向因果关系（10）。使用时间步长t = 0.001，我们产生100000步，对应于时间跨度t = 0-100。为了后续使用，我们将该系列初始化为远离平衡以允许一段时间的旋转，如图1所示。在大约t = 4之后，该系列达到静止状态。

在这里给出动力学解释，可以通过求解（3）来评估X1和X2之间的真实信息流。计算出的T2→1和T1→2如图1所示（虚线）。如预期的，T1→2equiv;0，因为X2的演化不依赖于X1。也就是说，对于X2，X1不是因果的。另一方面，X2驱动X1，因此是X1的因果;相应地T2→1不等于0。在这个例子中，无论协同变量如何初始化，T2→1都是一个常数0.1111，尽管结果可能在增长期间（t lt;4）有所不同。

图1

现在让我们看看简洁的公式（10）是否有助于恢复单向因果关系。我们所拥有的数据只是一个实现，即上面的示例路径。我们的目标当然不是估计T2→1和T1→2的整个演化过程，如图1所示。我们期望的是可以用可接受的信号来估计稳定值（T2→1 = 0.1111，T1→2 = 0）。为此，我们与不同分辨率和不同时间间隔和长度的样本路径形成不同的系列，然后测试估计的性能。测试结果列于表1。

显然，只要系列的时间跨度足够长，估计可以做得相当准确。对于静态数据（t = 5-100），即使每100个时间步长（对应于时间分辨率为0.1）对路径进行采样，这产生的时间序列只有1000个数据点，结果在一定误差范围内可接受。如果时间跨度短的话

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[26209]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码