基于神经网络法的降水预报外文翻译资料

2022-11-29 15:49:02

英语原文共 8 页，剩余内容已隐藏，支付完成后下载完整资料

基于神经网络法的降水预报

TONY HALL*

NOAA/NWS West Gulf River Forecast Center, Fort Worth, Texas HAROLD E.

BROOKS AND CHARLES A. DOSWELL III

NOAA/ERL/National Severe Storms Laboratory, Norman, Oklahoma

摘要：已经开发了通过将Eta模式和高空探测资料输入神经网络的方法用来为德克萨斯洲达拉斯沃斯堡做降水概率和定量降水量的预报。用2年36个测站雨量预报进行预报。超过70%的降水概率小于5%或者大于95%的预报结果非常清楚。其中降水概率小于5%的436的天中有435没有降水，降水概率大于95%的111天中江水总是发生。预报和观测降水相关系数达0.95.降水的却只在0.05到0.1英寸之间的公正预兆的分为0.63以上，最大值超过0.86.结合PoP和QPF的产品表明，对于很高的PoP,QPF和观测值之间相关系数要比较低的PoP对应相关系数要高。除此之外，在降水大于0.5英尺的70次观测中有61次与PoP大于85%有关。因此，该模式表明有更加准确的降水预报的潜力。

1 简介

降水的预测在各种情况下都很重要。降水的概率(PoP)是重要对降水发生敏感的许多决策者来说降水的概率(PoP)是重要的(例如,Roebber 和Bosart 1996)。一个精确的定量降水预报(QPF)可以识别潜在的强降水而且可能与洪水有关,同时对水文利益提供信息。作为现代化的美国国家气象局(NWS)的一部分,更多的关注是放在本地的QPFs及其在河流预报中心的水文模型中的使用后续。

数值天气预报模型为降水预报提供直接QPF指导。只要预测包含偏差和系统性的错误,然而,处理后的输出可以改善原始输出。许多统计方法可以用来做后处理。传统上,这些包括“完美掠夺”技术(Klein et al. 1959)和模式输出统计(MOS;Glahn and Lowry 1972)。这两种方法使用多元回归技术模型输出然后预报出合理的天气预报。他们考虑到采用单个模型解决方案显示天气预报的不确定性。如Myurphy(1993)表明,这样的不确定的表示对于预报员是有价值的。最近,在西湾河的水文预报中心使用了另一种处理技术,神经网络(Mullerand Reinhardt 1991),为Texas的Dallas-Fort Worth(DFW)市区开发一个降水预测工具。神经网络方案使用网格输出美国国家环境预测中心(NCEP)的Eta模型以及Fort Worth的高空探测数据。为降水概率和世界时1200到1200的24小时降水做预报。高空探测数据使用开始时期的,Eta模型预测数据来自1200 世界时的初始化。通过观察DWF的36 地区雨量数据的算数平均验证（图1）。降水事件要求这意味着雨量大于或等于0.01英寸 (0.25毫米)。在本文中,我们描述了神经网络预测的发展,最初是基于数据从1994年和1995年和随后再对每个月进行再学习，然后对从1 1996年3月至1998年2月28日,一段覆盖730天进行预报的验证。在这期间，每天都有预报和数据获得。

2 神经网络

神经网络提供了一个从噪音数据中提取模式的方法。他们被应用于各种各样的问题,其中包括在气象环境中的云的分类(Bankert 1994)和龙卷风预警（Marzban and Stumpf 1996)。Marzban and Stumpf （1996）讨论了神经网络相比其他统计模式的优点和缺点更多详细的关于神经网络的建立中可以Marzban和Stumpf、Muller和Reinhardt(1991)以及其中的参考文献找到。

使用神经网络的标准程序涉及到利用大量的具有代表性的数据“训练”网格。网络有一些输入和输出“节点”分别代表预测和预报值变量（图2）。在此之间,有一些隐藏节点排列在层次上。隐藏节点的和层的数量通常是根据经验来确定的，又来优化特定情况下的性能。特定层上的节点和其上面的层之间的每个连接可以由权重omega;_ij表示,表示第i个节点和第j个节点之间的连接的重要性。神经网络的训练阶段的目的是优化权重，使输出的均方误差最小化。对于特定层的每个节点,来自前一层的输入节点值乘以节点之间的连接的权重,然后所有不同的连接的值相加得到该节点的值。这个过程重复所有节点,然后对每个层。网络就可以使用新的输入值进行预测。在我们的应用程序中,我们已经创建了两个网络:降水量的QPF网络和降水概率的可能性或预测的信心的网络。²

QPF网络开发是用于预测24小时区域平均降水量,而不是个别站点的最大降雨量。根据Dallas-Fort Worth Metroplex附近36个地点的降水报告，我们预测24小时（1200至1200 UTC）的平均日降水量,覆盖大约5000平方公里。对于PoP网络，“无雨”定义为0，“有雨”定义为1。流行网络的输出结果是一个在0和1之间,这可能是乘以100给一个百分比。从1994年和1995年原始数据进行网络训练,无论降水发生的数量。

用于训练网络的输入数据由19个气象变量（表1）,加上实际降雨量组成。高空探测输入资料可以从Fort Worth,Texa获得。其他变量来自Eta模型的初步分析或预测领域。模式的数据是从PC-GRIDDS图表（Petersen 1992)以及NCEP设计的NWS产品中方的文本数据。开发了各种“测试”网络用来确定气象数据变量的数量和组合来提供最好的有关可获得的可能的降水量、抬升、不确定性的刻画。开始时发展网络小,主要集中在能代表大量降水的关键因素（Junker 1992;Borneman and Kadin 1994)。根据QPF的决策树方法（Johnson and Moser 1992),后来还包括了其他变量。最终我们采用了19个气象变量。

网络设计有三个重要的特点。第一个特点是全年的适用性。网络分别为的“暖季”(4-9月)和“冷季”(9-4月）开发。第二个特点是通过同时运行QPF和PoP来使整个过程,并同时在一台电脑上生成输出。最后一个特点,网络间是相互作用的,因此,可以改变任何所需的变量，并“重新运行”网络以适应任何预期的大气变化。对于预报者来说，因为能让他们进行“如果”练习，这种“互动”被证明是一个伟大的学习技术。例如,如果预测者认为模型没有处理好降水量，他们可以改变输入值然后再看看对预报的影响。如果锋面过境的时间有问题,从另一个位置值在另方面可以进行测试。

网络完成了许多灵敏度的分析。网络被重新培训，每月进行一次敏感性分析，以了解各种参数的重要性是否改变。分析通过个别参数值与输出预测的相关性来衡量变量。基于平均12个月的分析,在暖季和冷季的最总要的变量是不一样的，在每种情况下的降水量都是最重要的（表2）。这里提供的预测是实时完成的预测，以便包括上个月的再培训资料。但在初始培训期2年后，3- 9月两月的网络性能没有显着差异。这表明在最初的训练期之后，几乎没有获得额外的技能。可能的是，再培训过程可能会通过不断地将网络“推向”实际来保持技能。

训练周期由操作员停止。该软件所使用的迭代次数约为50万个，每个培训周期中都有10％的数据被用于测试网络性能。相关性的敏感性分析个人参数的价值与网络的输出预测以及不同参数的重要性以及如何在每个月之间变化。在初期培训阶段的变化很小，表2中的参数列表是12个月的平均排名。

3 结果

3.1 降水概率

属性图(Hsu和Murphy 1986)总结了降水概率（PoP)预测的性能（图3）。为了方便演示,我们讲预测分为11类,四舍五入到10%。在预报降水概率为0%的436天里只有一次降水了，在预报降水概率为100%的109天里都降水了。所有类别的PoP均预测为10％至90％。事实上,在PoP大于或等于38.5%的时候都降水了。然而,重要的是要注意预测发出的频率。两种最常见的预测类别分别为0%(59.7%的预测)和59.7%(15.2%的预测)。只有11.1%的预测在30% - -80%的类别。结果,预测具有清晰度和分辨率所需的性质（Murphy 1993）。从这个样本中，当系统产生高于约40％的值时，可以简单地重新校准预测值，以将预测PoP提高到100％。平均预测PoP为26.0％，样本观测到的下降34.2％。

在气候学方面，对于0％和100％的预测，预测的性能和几乎完美的表现形成了一个熟练的预测系统。 Brier分数（BS; Brier 1950; Wilks 1995）预测和事件之间的均方差：

其中fi是第i个预测值,xi是第i个事件(xi= 0%,没有雨,100%,有雨),n是预测数。技能评分，SS,可以使用某些参考预报系统的性能来计算：

其中BSref是参考系的Brier分数（Wilks 1995）。使用降水概率的样本气候学（34.2％）作为参考系统，神经网络预测的SS为73.0％。

不出所料,对于气候学凉爽的季节（11月至3月）PoP网络比温暖的季节（4月至10月）网络更准确。冷季的SS为79.1％（样本气候学= 32.1％），温暖季节仅为67.4％（样本气候学= 35.5％）。虽然温暖的PoP网络在10％-30％的PoP范围内具有更好的可靠性，但是由于观测到的降水频率更接近完美的可靠性线（图4），不如凉爽季节预测，这一点被证明是显而易见的。超过83%的凉爽季节预测出现小于5%或大于95%。只有68%的温暖季节预测分为这类。在凉爽季节PoP网络在没有雨是预报可靠性更强。超过65%(198/302)总数的预测降水概率不到5%中,只有其中一个与雨有关。

我们还根据持久性基线评估了Brier分数。持续性,定义为“前一天下雨了吗? ”,是一个比样本气候学更差的预测（SS = -42％）。有可能“在1200 UTC时下雨？”会比标准持久性好一些，但不太可能比样本气候学好得多。在这段时间的最后729天，有362次正确的持续性“预测”没有下雨，所有这些都有零误差点。117天没有降水的持续性预报和降水时间有关，最简单的假设是假定在1299UTC时间段了没有下雨，所以,所有的这些有最大误差点(100%的平方)。还有117个事件没有雨和前一天与雨有关。使用这些假设，在任何一个1200 UTC时都没有下雨，他们都没有得到任何错误点。前一天有133次雨天发生。为了使“1200 UTC持续性”预测比样本气候学更熟练，那些天1200UTC降水的频率要大于35%。鉴于一天下雨的频率，由于前一天下雨的时间只有53％，所以1200点的雨量似乎不太可能高达35％。即使在这些情况下没有错误，这似乎是极不可能的，只能将Brier技能得分提高到62％。

3.2 定量降水预报

预测和观察到的降水的分布说明了预测的准确性（图5）。预报和观测量之间的线性相关系数为0.95。预测和观测降水量的分布说明了预测的准确性（图5）。预测值与观测量之间的线性相关系数为0.95。最小二乘线性回归拟合表明存在一个小的条件偏差，降水量小于0.13（.3mm）是过度预报的，较高的数量是未预报的。淡季QPF的相关性为0.95，温暖季节为0.86，再次说明了凉爽季节网络的表现。

通过考虑QPF作为大于某个阈值的雨量预报，可以将问题分解为一系列2times;2应急表，每个表格用于不同的阈值。因此，例如，我们可以考虑系统对雨量大于0.5英寸（12.7毫米）的预报和观测的性能。然后，可以为每个阈值计算2times;2应急表的系统性能的标准度量（见表3）（Doswell等人，1990; Murphy 1996）。对于高达1英寸（25毫米）的几乎所有阈值，雨量检测的概率高于0.75（图6）。同时，所有阈值在0.08英寸（2毫米）和1英寸（25毫米）之间的误报率相当低，低于0.20。因此，对于0.03英寸（1毫米）和1英寸（25毫米）之间的任何阈值，预兆评分或关键成功指标[原名吉尔伯特成功率（吉尔伯特1884）3]从不低于0.63。与预兆分数相比，旨在惩罚过度预报事件的公平预报评分（ETS; Rogers等1996）遵循预兆分数，并且在低阈值下为0.67，最低值为0.63。（〜1毫米）和1英寸（〜25毫米）]，其中存在一些过度预报。与ETS很少超过0.44的操作数值天气预报系统相比，这些值相当高（例如Rogers等1996）。

技术措施,如正确技能统计（如TSS，也称为Kuiper的绩效指标，原为Peirce的“i”（Peirce 1884）]和Heidke的技能得分[原来的Doolittle的关联比率（Doolittle 1888）]相当高（图7 ）。他们通过系统对于机会的处理的好坏来评价它的性能。对于从0.05英寸（〜1毫米）到1英寸（25毫米）的所有值，TSS大于0.68，Heidke技能得分在该范围内大于0.77。这些值表明，对于广泛的降水量，神经网络的表现远远优于机会。

前面已经指出，所有预测的雨都发生在PoP大于或等于38.5％。重新校准可以提高PoP预测的可靠性，但原始输出PoP在QPF问题上具有价值;也就是说，预测和观测到的降水量之间的相关性随PoP而增加。对于PoP小于38%并发生降水的58个个例，相关系数为0.64.当52个个例的PoP在38.5%到85%之间是，相关系数增大到0.76，当PoP大于85%时，140个个例的相关系数达到0.94.因此，增加的PoP表明对预测的降水量有更大的可信度。该结果与Wilks（1990）发现的结果一致，使用条件概率降水量，给出MOS预测PoP。利用条件概率,给出一个

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[25722]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容！立即支付

注册

找回密码