登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 理工学类 > 自动化 > 正文

时序缓变数据的预测与缺失值填补文献综述

 2020-05-26 08:05  

文 献 综 述

目前,我国正处于自由竞争的市场经济体系中,在这样的市场机制下,一切都由市场来主导,于是为了及早的获知市场变化从而做出有效的决策,统计调查就越来越受到人们的重视。然而,在各种调查中总是存在着严重的无回答问题,导致了统计调查数据的缺损,给分析决策带来了影响。可以看到,几乎所有的调查公司都面临着这一尖锐问题,然而却并没有引起从业者及理论研究者的足够重视。一个突出的表现就是,不论是在官方机构还是民间机构的调查报告中,都常常缺少关于”无回答率”等技术指标的解释说明。在抽样调查中,常常会出现调查对象无回答的情况,当然,在增加人力、物力、财力,提高调查技巧和水平以及多次重访的条件下,无回答的现象可能会有所减少,但要在所有抽样调查中都完全消除无回答的现象是不现实的。而且实践也表明,调查中的无回答率正在呈逐渐上升的趋势,因此采取相应的对策解决此问题变得刻不容缓。

不仅在经济领域,在其他的各项研究领域都有可能出现数据残缺的情况。比如在医学研究中,经常需要对各种病历进行临床实验,此时就有很多数据资料需要搜集,但由于种种原因总是会出现某些数据缺失的情况,从而导致了统计分析的难度在工程测绘中,也会有很多需要采集数据的时候,同样也有可能在数据收集时出现缺失的情形。如何对这些缺损的数据进行处理,从而使我们的分析得以顺利进行也就成为了相关人员极其关注的一个问题了。对于调查中的无回答有两种类型,一种被称为”单位无回答”。它是指入选的样本单位由于各种原因没有接受调查,可以说这些样本单位交的是一份白卷。另一种被称为”项目无回答”,它是指被调查单位虽接受调查,但在某些调查项目上并没有提供有效的回答。与单位无回答相比,项目无回答还是或多或少地提供了一些被调查单位的信息,但还是不足以让我们拿来进行明确的统计分析。对于抽样调查中的缺失数据无回答部分,一般的调查公司和机构采取的都是取中间值或者是简单的删除缺失值或含有缺失值的单位,有的甚至采取”视而不见”的态度。很明显的,这样做就会出现调查出来的结果并不符合实际的情况发生,有时甚至会与实际情况产生天壤之别。

为了解决这个问题,那就是将数据残缺的部分进行填补,形成完整的数据结果,然后再来进行统计分析,并对预期数据进行预测,从而制定正确的决策。当然如何对残缺数据进行填补,使其能够较准确地反应调查的真实情况从而使我们得到的结果符合实际,就是一个很重要的问题了.现对国内外多种文献进行综述。

正如张婵(2013)【1】所说,对于数据集合上的缺失值填补,以往的填补方法如:均值填补、全局常量填补或者基于决策树回归的缺失值填补方法均有一定的不足。均值填补和全局常量填补等方法由于不能很好地拟合原始数据而导致缺失值填补准确率上存在不足,基于决策树回归的缺失值填补方法则对于噪声过于敏感,因此缺失值填补准确率也受到了一定程度的影响,她提出一种基于支持向量机的缺失值填补方法。

武森(2012)【2】提出基于不完备数据聚类的缺失数据填补方法(MIBOI),针对分类变量不完备数据集定义约束容差集合差异度,直接计算不完备数据对象集合内所有对象的总体相异程度,以不完备数据聚类的结果为基础进行缺失数据的填补.采用UCI机器学习基准数据集进行实验表明,MIBOI对缺失数据的填补是有效可行的。

王凤梅(2012)【3】提出一种基于近邻规则的缺失数据填补方法。根据关联规则的后件数据项进行分类,计算分类后的规则项与缺失项集间的相似度,用最相似的规则项值填补缺失值。实验结果表明,该方法具有较高的填补正确率。

孟娜(2006)【4】利用Matlab工具箱,对时序数据进行了两种不同形式的建模和预测。一是利用系统辨识方法来建立AR模型,利用所建模型进行预测;二是利用单隐层BP神经网络,对数据进行非线性拟合和预测。通过可视化,比较了两种方法的优劣。

张熙(2012)【5】提出分别应用模拟时间序列数据和实际时间序列数据模拟连续型缺失,比较两种方法在不同连续缺失个数下的缺失值填补效果。采用NRMSE和RMSE量化填补的误差。

陈光平(2012)【6】。以运动捕捉中遮挡问题为例提出了改进方法,利用平滑性和相互关联等时间序列数据特性,发现时间序列数据中的隐藏变量并挖掘它们的动态特性,在此基础上预测和填补时间序列的缺失值。实验结果证明了方法具有较小的数据重构误差,方法的计算时间应随着输入和运动捕捉持续时间增大而缓慢增长。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图