基于数据挖掘的图书荐阅方法开题报告

2022-01-25 22:52:37

全文总字数：4454字

1. 研究目的与意义及国内外研究现状

在中华文明源远流长的文明谱系中，阅读图书一直是人们汲取精神养料、提升认知水平的重要途径。但是随着经济社会的迅速发展，大众的阅读量却在悄然下降。据研究人员最新统计，中国每人年均读书阅读量4.66本、日本每人年均40本、韩国每人年均11本、法国每人年均14本、德国每人年均47本、犹太每人年均64本。全世界每年阅读书籍数量排名第一的是犹太人，这个民族诞生了诸多对人类文明进程作出巨大贡献的名人，如现代物理学之父——爱因斯坦、心理学家马斯洛、社会学大师韦伯等。可以推测，犹太人的杰出与他们庞大的阅读量不无关系。目前，如何提高大众阅读量，让大众喜爱阅读成了一个亟待解决的问题。在大数据时代的大背景下，我们考虑借助数据挖掘技术为大众提供更便捷、更符合个性偏好的图书推荐服务，从而增加大众阅读量。

选题的意义在于：

（1）提高馆藏图书的借阅率，通过计算读者兴趣相似度、发掘读者的潜在阅读兴趣为其推荐相关的书籍来实现图书资源的有效利用。此外，也能降低图书闲置时的储存、保养等管理成本。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

2. 研究的基本内容

拟选用数据挖掘中的聚类算法，选用协同过滤算法，基于用户-项目评分矩阵，选取相似度最高的几个邻居用户构建目标用户兴趣模型，产生预测评分值，将预测评分高的前n本书籍推荐给用户。

为提高兴趣模型的准确度，拟对常规相似度计算方法进行改进，将用户评分的相似度和用户属性特征的相似度进行线性加权得到用户综合相似度。

对数据集中的用户-项目评分矩阵进行聚类，数据集划分成多个簇后，每个簇内部的用户评分相似度较高，查找最近邻居时定位在离簇心距离最近的簇内查找，避免在整个数据集中查找，以此提高算法的效率和预测的准确性。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

3. 实施方案、进度安排及预期效果

实施方案：结合教师科研，小组成员讨论修正

进度安排：

从2018年12月开始，到2019年5月份。一共6个月。

剩余内容已隐藏，您需要先支付后才能查看该篇文章全部内容！

4. 参考文献

[1]jiawei han, micheline kamber.数据挖掘：概念与技术（原书第二版）[m]. 范明，孟小峰译.机械工业出版社,2007.

[2]毛国军，段立娟等.数据挖掘原理与算法[m]，清华大学出版社，2005.

[3] 路春霞．个性化推荐中协同过滤算法研究．北京：北京交通大学，2016

剩余内容已隐藏，您需要先支付 10元 才能查看该篇文章全部内容！立即支付

注册

找回密码