登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 计算机类 > 计算机科学与技术 > 正文

面向Web的大数据搜索系统设计与开发文献综述

 2020-04-14 10:04  

1.目的及意义

研究目的及意义:

随着大数据时代的来临,传统关系数据库已无法满足进行如此庞大的数据存储和分析。大数据开启了一次重大的时代转型[1],随着信息技术的发展,互联网的数据急剧增加,在海量复杂的数据中,如何高效便捷地获取信息已成为当前互联网服务商有待解决的问题,搜索系统的出现很好地解决了这一问题。[2]在大数据环境下,多学科跨领域合作已经成为信息发展的主要方向,面向大数据的信息资源搜索系统就要给予这一环境进行信息精准定位,以广域性搜索能力,改变原有的独立搜索系统覆盖范围窄的问题,面向大数据搜索可实现跨领域、跨学科的海量信息资源综合搜索

搜索技术是一项比较成熟的技术,它将因特网上的信息进行整合,对用户开放查询。搜索引擎主要工作原理分为三个部分:从网络中搜集数据;将数据进行整理;接受用户的查询。

为了提升大规模Web数据检索与分析的工作效率,在互联网大数据环境下有效、准确地检索Web数据,提出基于Elasticsearch大数据实时检索技术构建大数据搜索系统。

国内外研究现状:

国内发展现状:

目前主流的搜索引擎都是全文搜索引擎,检索了数以亿计的网页、文档等数据。虽然数据量巨大,但通过分布式系统,以及高度优化的系统构架设计,线上查询响应时间都可以控制在百毫秒之内。此外,主流的搜索引擎支持对查询中的错误进行纠错,对搜索关键词进行相关推荐,还提供基于用户属性的所搜结果个性化排序功能。随着信息时代的到来,数据的爆炸式增长,为了能够得到想要的信息,我们需要检索超大规模的文档,而此时,满足人们需求的搜索引擎也就应运而生。搜索引擎的出现,大大提高了人们对信息获取的需求和能力。百度、谷歌之类的全文搜索引擎,检索了数以亿计的网页文档,可以再瞬间响应用户的查询请求,为生活、工作、学术研究带来了极大的便利性。[3]

以百度、谷歌、搜狗、360搜索主要组成的国内最为专业的搜索工具为主要研究对象,对于相同问题的搜索结果所反馈的内容对比发现,搜索重复率低于10%。这使得用户在进行信息搜索时,往往需要通过采用多种搜索引擎进行资源挖掘和整合才能获取自身应用需求。由此,设计基于面向大数据搜索的搜索引擎,实现大数据信息资源综合搜索对未来搜索工具的发展具有非常重要的现实意义。

国内对搜索引擎的研究时间较短以及互联网技术革新技术较快,现阶段国内外关于搜索引擎的研究多集中于理论方面的探索,缺乏相关实践活动的研究,因此,如何帮助用户在海量的互联网信息中获取到所需的信息,采用哪种搜索引擎工作以及检索模式才能更快速、准确地找到所需的喜爱那个管向最强的信息,已成为目前信息研究人员有待为之努力解决的重要工作。[4]

在中国很多企业致力于搜索引擎的开发,像大家很熟悉的百度、Google、网易、搜狐、新浪等搜素引擎,现在中国的搜索引擎市场在告诉发展,有很好的前景。随着数据多元化的发展和用户对搜索服务的更多需求,搜索引擎往往也是捉襟见肘。国内知名搜索引擎像百度、阿里也重点转向云搜索服务,云搜索服务能为用户提供更搞笑的数据检索,随着互联网用户的增加,个性化用户的增多,企业也致力于为用户提供个性化搜索服务。[5]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图