登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

基于纠删码和副本的内存文件系统设计及实现文献综述

 2020-05-04 09:05  

1.目的及意义

1.1题目:基于纠删码和副本的内存文件系统设计及实现

1.2背景及意义:

随着企业、机构、个人对信息技术的依赖程度提高,越来越多的用户数据和业务数据被存储在计算机系统中。数据信息化在提高工作效率和业务水平的同时,也带来了数据丢失风险,一旦系统中关键数据丢失或损毁,将导致不可估量的直接和间接经济损失。假设存放在淘宝网站或腾讯网站上的用户数据(如,身份证、银行卡、家庭照片、交易记录等隐私信息)发生大面积丢失或泄漏,后果将不可想象,不仅用户会弃之而去,企业也将信誉受损、官司缠身。根据 IDC 咨询公司的调查结果,美国在20世纪后10年发生过数据灾难的公司中,55%当即倒闭,剩下45%中由于信息数据丢失,29%在两年内倒闭,能生存下来的仅占16%。而著名IT咨询服务提供商Gartner的报告数据也表明,40%的企业不能在灾难发生后恢复运营,剩下60%中有33%在两年内倒闭。据美国明尼苏达大学的一项研究报告显示,在灾害之后,如果无法在14天内恢复资讯作业,有75%的公司业务会完全停顿,43%再也无法重新开业,因而有20%的企业在两年之内被迫宣告破产[1]

数据如此重要,因此需要提高存储系统可靠性以增强数据可用性。为了保障存储可靠性与数据可用性,必须采用数据冗余机制。冗余机制主要包括副本(Replication)和纠删码(Erasure Codes)技术,前者将每个原始数据分块都镜像复制到另一个存储设备上,以保证原始数据不可用时有副本可恢复;后者将原始数据进行划分、编码和分发,后将编码分块独立存储到存储设备上。相对于副本技术,纠删码具有更高的存储效率(即,存储空间利用率),在相同存储空间情况下能获得更高的容错能力。如今,纠删码已成为副本之外的另一种可靠存储方式,广泛应用于存储系统中,如面向大数据挖掘的集群存储、面向数据托管的云存储、和面向数据长期保存的归档存等。

1.3国内研究现状:

国内学者在纠删码方面开展了富有成效的研究工作。通过梳理国内在纠删码存储方面的文献,发现国内的纠删码存储研究主要集中于磁盘阵列与阵列编码两个分支上,如中科院研究生院提出一类纠双错MDS阵列纠删码(V码)[2];南开大学对大规模磁盘阵列下多容错编码方面进行了研究[3];西北工业大学设计了一种容三错RAID布局(TP-RAID)[4];国防科技大学为大规模存储系统设计了一种高容错低修复成本的编码EXPyramid[5];中国科技大学为RAID-6存储系统提出一种优行对角校验恢复方法(RDOR),以少磁盘读来完成单盘重构[6];清华大学对磁盘阵列的容错编码技术进行了研究,分别为RAID-6和大规模磁盘阵列设计了C码和GRID码[7],并提出一种RAID扩容方FastScale[8];华中科技大学也对磁盘阵列的容错编码和重构优化进行了研究,为RAID-6设计了P编码[9]和M编码[10],以及RAID重构优化方案WorkOut[11]

1.4国外研究现状:

纠删码存储集群相关研究主要集中于国外大公司,具体地,这些公司为各自大规模存储系统产品提供设计方案和优化方案,例如:Google在其GFS文件系统中增加了RS码支持[12];微软研制的Azure云存储系统也支持RS码[13],其研究团队在此RS码基础上设计了具有重构优化特性的局部重构编码(Local Reconstruction Code,LRC)[14];Facebook采用Hadoop HDFS来搭建其Blob存储集群,其采用了Mirrored RAID-5编码和RS编码[15],其也支持一种缩短重构链的局部修复编码(Locally Repairable Codes,LRCs)[16];IBM所收购的Cleversafe致力于归档存储,其采用柯西RS码来获得高性价比存储[17]

{title}

2. 研究的基本内容与方案

{title}

2.1基本内容与目标:

基本内容:在Linux环境下编写测试程序,在基于纠删码的内存文件系统上、基于副本的内存文件系统上和基于副本的磁盘文件系统上完成数据创建写、数据更新写、数据失效读、正常读这四项访问操作,测试这四项访问操作的性能,从而分析上述不同存储设备访问性能的原因,剖析纠删码和副本技术的差异。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图