登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 计算机类 > 计算机科学与技术 > 正文

微博用户情感分析方法研究与实现开题报告

 2020-02-18 07:02  

1. 研究目的与意义(文献综述)

随着Web2.0时代的兴起, 用户作为信息浏览者的同时,参与互联网信息的制作和管理。微博就是基于Web2.0模式下的一种新兴媒体。它具备碎片化、多媒体化的文本内容、基于用户关系的传播以及即时的发布的特性,同时用户可以通过PC、手机等多种终端接入,吸引了众多用户。近几年来,微博在国内得到了广泛的推广,在2017年,微博第一季度月活跃用户增长了2700万至3.4亿,超过同季度Twitter的水平。用户数量飞速增长的同时,其应用领域也不断的扩张。对于个体,用户的按照个人的偏好,关注不同的用户同时查看自己需要的信息,对于不同的事件,也可以通过微博真实地表达自己的观点。在企业方面,企业能通过微博平台发布自身的最新状态更加及时地传递消息给老顾客并吸引新顾客。在政府层面,政府能通过微博平台实现机构的透明化、公开化,使群众更加全面地了解其运作和流程。由于微博中具备海量的信息,有效地对微博信息进行情感分析和挖掘,并整合分析结果。对于用户个体,可以迅速了解自身的需求,针对具体问题更精确地解决。在企业层面,企业能了解用户的需求,尽快地定点改进。在政府机关方面,能够及时知晓民众意见,提前预测舆论方向,有助于进行舆情监控和处理相应社会问题。

在情感分析方面,现主要使用的技术分两大类:一类是采用情感词典与规则相结合的方法,根据文本中包含的正向情感词和负向情感词的个数来进行情感分类;另一类是采用机器学习的方法,选择文本中的一些特征,标注训练集合测试集,使用朴素贝叶斯(Naiuml;ve Bayes)、最大熵(MaxEntropy)、支持向量机(Support Vector Machine)等分类器来进行情感分类。总体来看,使用情感词典与规则相结合的方式,其优点在于应用在词语特征级,分析精准,难点在于构建一个足够满足众多领域、足够大的情感词典和中文的特征提取。通常,在构建中文情感词典,采取的方式是对已有的情感词典进行总结和整理,另一部分,通过人工标注和采用扩展的情感倾向带你互信息算法(Semantic Orientation Pointwise Mutual Information,SO-PMI)从微博中自动获取的方式进行补充。另一方面,使用机器学习实现情感分类关键在于特征信息的提取,所以它特别依赖于正确的训练语库,同时训练周期相对较长。

2. 研究的基本内容与方案


本毕业设计研究的基本内容是构建基本情感词典,然后针对基本情感词典无法适应于微博情分析的问题,进行情感词典的扩充。最后结合扩充情感词典及规则实现情感分析。本次毕业设计的具体目标是,使用者通过给出微博的情况,通过运行系统,最终得到情感分析结果。


剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究计划与安排


  1. 2019年2月23日到2019年3月1日:java编程能力的强化和lucene开源库的学习;

  2. 2019年3月2号到2019年3月10日:搜集构建情感词典资料;

    剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

    4. 参考文献(12篇以上)

    [1] 郑佳. 面向社会安全事件的公众情感倾向分析研究[d].北京信息科技大学,2018.

    [2] 刘楠. 面向微博短文本的情感分析研究[d].武汉大学,2013.

    剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图