基于大数据分析的信息技术文献推荐系统开题报告

 2020-02-18 07:02

1. 研究目的与意义(文献综述)

为了帮助研究人员从数量繁多、质量参差不齐的信息文献中,快速高效地查阅到符合研究人员需求的高质量的信息技术文献,解决现今“有限的信息处理能力与信息庞杂之间的矛盾”,遏制由于现行信息技术文献评价体系缺失和错位所导致的学术垃圾的泛滥和学术的不端行为,笔者在前人研究的基础上,探索基于大数据分析的信息技术文献推荐系统。

通过阅读和研习当前国内外学者对学术信息推荐方法的研究文献发现,该研究主要是建立在基于内容、协同过滤和混合算法三种基本的推荐方法基础之上,利用了这些基本算法的思路,对某些细节进行了改进或创新,提出针对学术信息的推荐方法。

在基于内容的学术信息推荐方法领域,梁莘燊等利用 plsa模型进行主题建模,从文献所包含的单词中估算文献可能属于某一个主题的概率,并将相同主题的文献聚类,将聚类的主题与用户偏好的主题进行比较,找出符合用户主题兴趣的相关候选子集,然后利用效能挖掘的技术从相关候选子集中挖掘效能较高的推荐对象集合;sugiyam 等以研究人员发表的出版物和其近邻的论文———施引文献和参考文献作为其潜在研究兴趣的来源构建用户档案。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容与方案

学习和研究大数据分析处理原理和方法。重点研究基于大数据分析的信息技术文献推荐方法,在Visual Studio 2010或Java环境下实现,并对结果进行比较分析。现有的智能文献推荐方法, 比较主流的有三种:基于内容推荐法、协同过滤推荐系统法和关联规则推荐法。三种推荐方式, 对于源数据的种类不同, 应用的方式也就不同。基于内容推荐法, 其核心是内容过滤, 扫描出推荐内容与读者需求内容的相似, 从而对读者进行推荐;协同过滤推荐系统法:其核心是针对特定读者群体或者书籍群体, 基于读者的协同过滤推荐, 通过读者对于资源的评价, 匹配不同读者的之间的相似度, 寻找偏好相似的读者, 对偏好相似的读者匹配的一种推荐方式;基于关联分析的推荐系统法, 其核心是数据匹配、聚类等数据挖掘方法。利用根据研究的内容,拟采用的方案和措施是采用 Hadoop 平台来实现系统的设计。我的想法是首先学习和研究大数据分析处理原理,分别比较三种算法的优劣,然后在VC 或Java环境下实现,接着对结果进行比较分析,找到最佳的基于大数据分析的信息技术文献推荐系统方法,最后完成毕业设计论文。


3. 研究计划与安排

第 1 周—第 3 周 搜集资料,撰写开题报告,提交开题报告;

第 4 周—第 6 周 搭建开发环境,学习开发语言,系统总体设计;

第 7 周—第 11 周 分步实施,实验及分析比较,完善推荐系统;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献(12篇以上)

[1] 林子雨.大数据技术原理与应用(第2版)[m],北京,人民邮电出版社 ,2017.

[2] 陈明.大数据基础与应用(第2版)[m],北京,北京师范大学出版社 ,2018.

[3] 项亮.推荐系统实践[m],北京,人民邮电出版社出版 , 2012.

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。