登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 管理学类 > 信息管理与信息系统 > 正文

基于模糊集理论的群体推荐系统研究毕业论文

 2020-02-19 08:02  

摘 要

随着互联网,尤其是移动互联网的兴起,在海量的信息中挖掘出有用的信息变成了一件困难的事情。为了解决信息过载所带来的问题,推荐系统应运而生。推荐系统可以被看作是根据某种依据,为用户推荐最合适他们的信息、服务、物品等的一个系统,是提高网站的用户满意度和收益的一个有效工具。目前国内外各大网站都应用了推荐系统,比如国内的淘宝、京东、今日头条以及国外的亚马逊、Apple iTunes等网站。信息过载的大环境下,帮助用户筛选出真正符合他们需求的有效信息。

早期的推荐系统的推荐依据是人口统计,因为当时的信息技术没有像今天这样先进,而人口统计这样的信息是比较容易获取的。之后随着信息技术的发展,协同过滤和基于内容的推荐系统成为了推荐系统中比较热门的推荐技术。前者是依据用户以往对于物品的评分,通过已知评分来预测得到未知评分,从而得到推荐结果;后者则是根据用户以往的喜好和物品本身的属性,来完成推荐工作的。然后应用比较广泛的推荐方法还有混合过滤的方法,即,使用多种数据源和多种模型进行混合过滤,从而得到最终的推荐结果。

由于很多时候人们是以群体的形式来参加娱乐、饮食等活动,加之近些年来虚拟社区不断增多,所以在这些情况下,构建群体推荐系统,向群体用户提供群体的个性化推荐,减少他们搜索信息所需要的时间变得尤为重要。最早的群体推荐系统是由McCarthy等开发的MusicFX系统,该系统向处于同一个公巧场所的人推荐所要播放的音乐。近些年来,推荐的项目逐步扩展到餐饮、电影、旅行、网页等领域,成为了推荐算法中的研究热点。

现实中经常会出现这样的情况,会有一些词语,比如好看,不错,一般等。这些词语很难被量化,难以给他们一个准确的数值。在这种情况下,模糊集理论就派上了用场。群体推荐中协调群体中的不同个体的不同偏好,做出最终的推荐决策,同样是一个难以量化的问题。我们将构建一个基于模糊集理论的模型,来得到一个评分与隶属度的函数,从而实现这些概念与数值之间的转化,借此解决群体推荐过程中,如何协调各个个体,尽可能照顾到所有个体的偏好的问题,实现整个群体推荐效果最佳。

关键词:推荐系统;群体推荐;模糊集理论

Abstract

With the rise of the Internet, especially the mobile Internet, it has become a difficult thing to dig out useful information from the vast amount of information. In order to solve the problem of information overload, recommendation system came into being. Recommendation system can be regarded as a system to recommend the most suitable information, services and goods for users according to some basis, which is an effective tool to improve the user satisfaction and revenue of the website. At present, major websites at home and abroad have applied the recommendation system, such as domestic Taobao, JD, Headline and foreign websites such as amazon and Apple iTunes. Under the environment of information overload, help users to screen out the effective information that really meets their needs.

Early recommendation systems relied on demographics, because information technology was not as advanced as it is today, and demographic information was easily available. Later, with the development of information technology, collaborative filtering and content-based recommendation system become the popular recommendation technologies in the recommendation system. The former is based on the user's previous rating of the item, and the unknown rating is predicted by the known rating, so as to get the recommendation result. The latter is based on the user's previous preferences and the properties of the item itself to complete the recommendation work. Then, the widely used recommendation method and the mixed filtering method are applied, that is, the mixed filtering is conducted with multiple data sources and multiple models to obtain the final recommendation results.

In many cases, people take part in entertainment, food and other activities in groups. In addition, virtual communities have been increasing in recent years. Therefore, it is particularly important to build a group recommendation system, provide group personalized recommendations to group users and reduce the time they need to search for information. The earliest group recommendation system was MusicFX, developed by McCarthy and others, which recommends music to be played to people in the same public place. In recent years, recommended projects have been gradually expanded to catering, movies, travel, web pages and other fields, becoming a research hotspot in recommendation algorithms.

In reality, there are often such a situation, there will be some words, such as good, nearly, general and so on. These words are hard to quantify, hard to give an accurate number to. In this case, fuzzy set theory comes in handy. It is also difficult to quantify the problem of coordinating the different preferences of different individuals in the group to make the final recommendation decision. We will build a model based on fuzzy set theory, to get a score and membership function, so as to realize conversion between these concepts and values. And use it to solve the problem that how to coordinate the individuals, take care of all the individual preferences as far as possible and maintaining the best recommendation effect in the group recommended process.

Keywords:recommender system; group recommendation; fuzzy set theory

目 录

摘 要 I

Abstract II

第 1 章 绪论 1

1.1 研究目的 1

1.2 研究意义 3

1.3 国内外研究现状 3

1.4 技术方案 4

第 2 章 推荐系统的相关概念 6

2.1 推荐系统主要算法 6

2.1.1 基于人口统计学的推荐 6

2.1.2 基于内容的推荐 7

2.1.3 基于协同过滤的推荐 9

2.1.4 优缺点分析 10

2.1.5 混合推荐 11

2.2 推荐系统的评测 13

2.2.1 评测方式 13

2.2.2 评测指标 14

2.3 群体推荐系统的推荐算法 15

第 3 章 基于模糊集理论的群体推荐系统算法设计 17

3.1 数据的选取 17

3.1.1 MovieLens数据集 17

3.1.2 数据集的随机分配 18

3.2 基于用户的协同过滤推荐 19

3.3 相似度计算 24

3.4 群体推荐系统算法设计 25

3.5 算法总结 26

第 4 章 系统设计 27

4.1 系统总体设计 27

4.1.1 功能模块设计 27

4.1.2 物理配置方案设计 27

4.2 输入输出设计 27

4.3 页面设计 28

第 5 章 系统实施 31

5.1 相关参数对比测试 31

5.1.1 电影推荐所需相似用户数N 31

5.1.2 推荐电影数K 32

5.1.3 预测评分所需相似用户数X 32

5.2 系统运行流程 33

第 6 章 总结与展望 35

6.1 研究结论与创新点 35

6.2 研究展望 35

致谢 37

参考文献 38

绪论

研究目的

随着互联网,尤其是移动互联网的兴起,信息系统获取数据变得越来越容易,获得的数据也越来越多,在海量的信息中挖掘出有用的信息变成了一件困难的事情[[1]]。推荐系统在众多的选择可能范围内引导用户发现感兴趣的或者是符合他们需求的个性化推荐结果[[2]]。比如,在电商网站中存在着大量的同类物品,用户想要购买一个物品,将有很多个选择,在这个时候推荐系统的职责就是给用户推荐出更符合他心中所想的那个物品。

推荐系统是一种软件工具和技术方法,它可以向用户建议有用的物品[[3],[4],[5]]。它可以被看作是根据某种依据,为用户推荐最合适他们的信息、服务、商品等的一个系统,是提高网站的用户满意度和收益的一个有效工具。本文中将使用“物品”这个词语作为推荐系统所推荐内容的总称。

推荐系统根本目的是为了让销售者获得利益,所以增加产品的销售量是其主要目的。通过将过滤过的物品推荐给用户,推荐系统可以增加用户对相关物品的关注,从而增加销售,提高利润。虽然主要目的是盈利,但是实现其功能的方法并不是很直观的。一般来说推荐系统在技术操作上的目的如下:

(1)相关性:对推荐系统来说,最重要的技术操作目的是给用户推荐与其相关的物品。对用户而言,他们更可能使用他们认为有意思的那些物品。尽管相关性这个特性是推荐系统的重要技术操作目的,但并不足够充分,因为并不是所有与用户相关的物品都是用户认为有趣的物品。所以,我们在之后还会继续讨论一些虽然重要性比相关性低,但依然对结果有着很大影响的其他技术操作上的目的。

(2)新颖性:在给用户推荐他没有见过的物品时,推荐系统的推荐效果确实比较好。例如,当用户喜欢的电影的类型并不太热门时,总是给用户推荐热门电影,反而会造成物品的销售量减少,同时也会降低销售物品的多样性[[6]]。

(3)意外性:所谓意外性,就是推荐的东西让用户感到意外[[7]]。这种推荐相比于那些显而易见的推荐会有特殊的效果。意外性和新颖性的不同之处在于,不是简单地推荐先前没有见过的两件事,而是用户能够真正地感觉到惊喜。一般情况下,用户可能只是消费特定的东西,但不排除同时存在能让他们高兴的东西。意外性把重点放在发现这种推荐上,这就是他与新颖性的不同点。比如,在一家中国餐厅中,以往一直是以做川菜为主,当有一天突然推出一款粤菜时,顾客之前不知道有这样的菜种,觉得很新鲜,这个是新颖性。当这家餐厅突然推出一款别的家餐厅做过的类似的菜,顾客会觉得很惊喜,发现,这里居然也有这类菜,从而增加顾客的消费欲望,这个就让顾客感觉到了惊喜。

(4)多样性:推荐系统推荐的一般会是一个推荐列表,上面有推荐指数排名top-k的物品,可是当所有推荐的物品都很类似时,用户可能对这一类推荐均不感兴趣,这就提高了整个列表推荐均失败的风险。另一方面,如果在推荐列表中包括不同类型的物品,用户在这个列表中至少对一个感兴趣的可能性就会增加。多样性的目的就是防止用户对某一类物品反复被推荐产生厌烦。

由于很多时候人们是以群体的形式来参加娱乐、饮食等活动,比如几个朋友一起去看电影,几个同事一起去聚餐等。这种情况下,仅仅是分别向个人进行推荐,就显得有些不足,这种推荐方式难以让整个群体的推荐满意度达到一个较高的水平。加之近些年来虚拟社区不断增多,对类似虚拟社区这样的群体进行推荐的需求增多,比如向爱狗群体推荐宠物狗的玩具、狗粮等物品。所以在这些情况下,构建群体推荐系统,向群体用户提供群体的个性化推荐,减少他们搜索信息所需要的时间变得尤为重要。本文针对的就是对群体进行推荐任务的群体推荐系统。

研究意义

对用户而言,网站使用推荐系统,会提高用户的满意度和忠诚度。当用户在一个电影售票网站得到了一个令他满意的推荐,他对这个网站的满意度就会增加,在这之后他会倾向于继续在这个网站进行电影购票,这就增加了用户的忠诚度。对商家而言,电影售票网站的推荐系统会提高商家的收益。当用户只是在浏览网页时,突然见到一个满意的推荐,会增加用户的购票的欲望,进而提高了商家的收益。商家也可以通过推荐系统,来将那些热门的电影或者不热门的电影推荐给对应的用户,让热门的电影销量更好,不热门的电影销量提高。

本系统作为推荐系统,能够带来以下优点:

(1)用户在面对巨大数据量的情况下,难以做出较为准确的选择的问题;

(2)当用户没有明确需求时,提高用户的购买欲望或浏览欲望,以增加网站的销售量或浏览量;

(3)提高用户对网站的满意度和忠诚度;

本系统作为群体推荐系统,能够为群体带来最符合整个群体兴趣偏好的个性化推荐。不同于分别向群体中的每个个体单独推荐,群体推荐在算法上会将每个个体的兴趣偏好综合考虑,最终得到一个经过权衡的综合推荐效果最好的推荐结果,来推荐给这个群体。本系统将会在群体推荐的算法基础上,借鉴模糊集理论的相关思想,来进一步优化群体推荐算法,这部分内容将在第三章中具体体现。

国内外研究现状

对于推荐系统的研究,国外是要早于国内的。不过随着近些年移动互联的广泛使用,国内的推荐系统也得到了迅速发展。在20世纪90年代中期,推荐系统成为一个独立的研究领域[[8],[9],[10]]。

GroupLens推荐系统是早期的一个推荐模型,用来完成Usenet新闻的相关推荐。他通过采集Usenet网站中用户对已读新闻的评分来预测用户对于一些未读新闻的评分,将预测评分较高,即该用户可能感兴趣的新闻推荐给他。这就是协同过滤算法的原型。基于这个推荐模型,还发展出了其他的比较有名的推荐产品,包括用于图书推荐的BookLens和用于电影推荐的MovieLens等。GroupLens的研究小组还发布了MovieLens数据集,包括十万个评分、一百万个评分和一千万个评分三个数量级。这几个数据集为之后的推荐系统研究测试工作带来了很大的便利,是这个研究小组的一个巨大贡献。

我们身边应用推荐系统获取利润的典型代表就是电商平台。电商平台通过向用户推荐他们感兴趣的商品来刺激用户消费,已达到提高销售量的目的。国外电商的典型代表就是Amazon[[11]],在亚马逊,网站采用个性化推荐系统为每个用户进行推荐[[12]],从最初的图书推荐,到现在的涉及到各个领域的商品,包括数码产品、家用电器、服装服饰、护肤品、生活用品等。Amazon的推荐系统的依据是用户的评分、购买行为、浏览行为等反馈。其中评分被认为是用户的显示反馈,购买行为、浏览行为等被认为是用户的隐式行为。基于这些行为,Amazon完成了对用户的偏好判断,进而给用户定制个性化页面,完成个性化推荐。国内的电商平台在近几年迅速发展,发展最为迅速的是淘宝、京东等。它们采用的推荐方式是多种推荐算法混合推荐的方式,包括热门推荐模块、根据个人浏览购买历史来定制个人偏好进行推荐的“猜你喜欢”模块、根据与用户同类型的其他用户的偏好来对用户进行推荐的“同学都在买”模块等,通过各类推荐方式来完成整个系统的各方面推荐需求,覆盖用户的大部分使用场景。

最早的群体推荐系统是由McCarthy等开发的MusicFX系统[[13]],该系统向处于同一个公巧场所的人推荐所要播放的音乐。每一个使用者事先对备选音乐进行评分,系统通过分析这些评分,来得到推荐结果。近些年来,群体推荐的物品逐步扩展到餐饮、电影、旅行、新闻等领域,成为了推荐算法中的研究热点。类似的还有Apple Music等网站[[14]],也是用于推荐音乐的群体推荐。

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图