登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 开题报告 > 计算机类 > 计算机科学与技术 > 正文

针对哔哩哔哩弹幕网的舆情信息采集系统的分析与设计开题报告

 2022-01-14 09:01  

全文总字数:2748字

1. 研究目的与意义及国内外研究现状

随着互联网使用人数的不断增多,更多的人可以在互联网的平台上发表他们的评论,这些评论可能包括对某一事物的喜好,对某一时事的评讨,对某个知识的讲解或解释,当然还有可能会有居心叵测的人发表煽动人心的言论。无论这些言论价值观是普世的还是负面的,随着数量的增多,如果不能合理的对其分析和引导,将会是一个非常大的隐患。这也要求政府和互联网企业做好舆情的监控和引导。这也是本系统分析设计的一个非常重要的原因之一,这个原因也是主要原因。

由于在互联网上发表言论的人,多是匿名的或半匿名(半匿名指发表言论者如果未主动透露自己的信息,普通网民无法知道发表言论者的真实身份,只能知道其昵称,但是施行互联网实名制的互联网平台方是能够知道的)的,所以这些言论更能表达言论者内心的真实想法,这比线下的民意调查要更加的有价值。这也是本设计本系统的另一个原因。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

本次设计分析并设计了一个针对哔哩哔哩弹幕网,基于爬虫的,面向开发者和研究人员的舆情信息采集系统。主要内容为开发运行环境的搭建与测试,需求及技术分析,系统详细设计及实施,最终总结。主要涉及到了以下几个计算机相关的领域:Web安全与测试,App安全与测试,Web开发,跨平台GUI开发,数据分析。涉及的技术更是有:正则表达式,爬虫及反爬虫(反反爬虫)技术,基于xml的GUI设计,中间人攻击,xpath等。

3. 实施方案、进度安排及预期效果

方案主要分为三步,即环境的部署,各模块的分析实施,最后的整合发布。

整个设计过程在一个月内完成。

1.第一周进行对国内外采集系统和爬虫的研究,总结和本次设计的目标和具体需求;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]oesper l, merico d, isserlin r, et al. wordcloud: a cytoscape plugin to create a visual semantic summary of networks[j]. source code for biology and medicine,6,1(2011-04-07), 2011, 6(1):1-4.

[2] myers d, mcguffee j w. choosing scrapy[m]. 2015.

[3] 陈利婷. 大数据时代的反爬虫技术[j]. 电脑与信息技术, 2016, 24(6):60-61,共2页.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图