登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 文献综述 > 电子信息类 > 电子科学与技术 > 正文

基于python的微信好友数据分析系统文献综述

 2020-04-14 04:04  

1.目的及意义
微信是一款时下非常火爆的即时通讯工具,可以说每个人的手机上都会有这款软件。微信作为一种以社交为目的的生活类软件,其最大的优势在于打通了线上与线下的界限,用户可以有选择的为自己划分圈子,与陌生人进行交流。微信已经不仅仅是一款即时通讯工具,它所涵盖的类型包括SNS社交网站、内容与视频分享、基于空间定位的陌生人交友等等内容,这是一款跨越多平台的社交软件。这对用户的意义在于,用户可以使用一款软件便可得到以前多种软件才能达到的效果。而微信与腾讯QQ的无缝对接,更是打通了手机与电脑的界限,实现了随时随地的社交目的。在微信里,我们每个人都或多或少的有一些好友,而这些好友都会有着不同的头像,签名,位置等信息,我们可以通过数据分析来将这些信息进行聚类,然后可以通过图表来进行分析,以便直观地得出结论。如何进行数据挖掘和分析呢?我们可以采用当下比较流行的python语言来完成。
Python是一种计算机程序设计语言。是一种动态的、面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。python有多种实用的功能,最常用的有人工智能,数据分析,web开发,网络爬虫等功能,我们需要使用的就是其中的数据分析和网络爬虫功能。
本设计所研究的内容非常贴近生活,联系实际,国内外已有很多人在这方面提出见解,我们目前需要解决的问题有:如何获取到微信上面好友的数据,需要如何处理这些数据,采用哪一种方式来对图片和文字进行分析归类等。由于python的自建库和第三方库的存在,可供我们使用的第三方模块非常的丰富,我们可以通过这些模块来完成本次设计,达到做出一个微信好友数据分析系统的目的。
通过完成本次微信好友数据分析系统的设计,我们可以对微信上好友的信息进行一个大概的了解,从多种角度来看微信好友的构成。不知道从什么时候开始,微信朋友圈变得越来越复杂。逐步泛化的好友关系,让微信从熟人社交逐渐过渡到陌生人社交,而朋友圈里亦真亦幻的状态更新,仿佛在努力证明每一个个体的”有趣”,我们可以通过本次设计,粗略统计你的微信好友们的总体状态信息,或许这也是数据分析的意义之一吧。
{title}

2. 研究的基本内容与方案

{title}

本次设计所希望达到的程度,是在获取所有微信好友的性别,头像,签名,位置等信息的同时,同时尽可能简单明了的将这些信息显示出来,以达到数据分析的目的。


首先,分析微信好友数据的前提是获得好友信息,调用python上的itchat模块,这将会变得非常简单,像平时我们登陆网页版微信一样,使用手机微信扫描二维码即可,然后通过调用方法会返回好友的信息。


接下来我们可以将我们需要的信息提取出来,首先是性别,把所有好友的性别放入一个扇形或饼状图中是一个比较直观的方法,这时候就可以用到python中著名的matplotlib模块进行绘制图表,通过合适的方式将数据导入到matplotlib中就能得到扇形图。


我们再来看看好友的头像,我想的是从两个角度来分析,一个是这些头像中人脸头像所占的比率,另一个是这些头像中包含的关键字。

把通过从itchat返回的头像字段把头像下载到本地,然后根据腾讯优图提供的API接口检测头像图片中是否存在人脸以及提取图片中的标签,最后是否使用人脸头像可以输入到matplotlib生成一个饼状图,标签可以通过词云作为输出的方式,让我们更为直观的了解好友们的头像。


接下来是好友的签名信息,从签名可以大概看出人们近期的生活状态,我们对从itchat中提出来的签名用jieba模块分词然后生成词云,了解其中出现的关键字的频率,然后python中的snownlp模块对这些词进行情感分析,可以判断出是积极的还是消极的或者中立的,最后还是通过matplotlib输出成一个柱状图,可以得出相应结论。


最后我们来了解一下好友们的位置归属信息,看一看好友们大多数来自哪个省份哪个城市,通过提取itchat输出的province和city两个字段,然后再导入到地图中即可实现非常明显的好友地理位置分布图。

3. 参考文献
[1] Wesley J.Chun著;杨涛等译.Python核心编程[M].北京:机械工业出版社.2001.
[2]胡松涛著.PYTHON 网络爬虫实战[M].北京:清华大学出版社.2017.
[3]Clinton W.Brownley著.Python数据分析基础[M].南京:东南大学出版社.2017.
[4]张良均著.Python与数据挖掘[M].北京:机械工业出版社.2016.
[5]范传辉编著.Python爬虫开发与项目实战[M].北京:机械工业出版社.2017.
[6]Martin C.Brown著;康博译.Python技术参考大全[M].北京:清华大学出版社.2002.
[7]董付国.Python可以这样学[M].北京:清华大学出版社.2017.
[8]顾立平,田鹏伟.数据馆员的Python简明手册[M].北京:科学技术文献出版社.2017.
[9]John Goerzen著;莫迟等译.Python网络编程基础[M].北京:电子工业出版社.2007.
[10]卢茨著.Python袖珍指南 第5版[M].北京:中国电力出版社.2015.
[11]卡塞尔,高尔德著.Python项目开发实战[M].北京:清华大学出版社.2015.
[12]张燕妮主编.Python即学即用[M].北京:机械工业出版社.2016.
[13] Jesus Rogel-salazar. Data Science And Analytics With Python. CRC Press.2015.
[14] Naomi Ceder. The Quick Python Book Third Edition. Manning Publications, Nicholas Tollervey.2018.
[15] Jake VanderPlas. Python data science handbook. O'Reilly Media.2016.


剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图