针对哔哩哔哩弹幕网的舆情信息采集系统的分析与设计开题报告
2022-01-14 21:13:14
全文总字数:2748字
1. 研究目的与意义及国内外研究现状
随着互联网使用人数的不断增多,更多的人可以在互联网的平台上发表他们的评论,这些评论可能包括对某一事物的喜好,对某一时事的评讨,对某个知识的讲解或解释,当然还有可能会有居心叵测的人发表煽动人心的言论。无论这些言论价值观是普世的还是负面的,随着数量的增多,如果不能合理的对其分析和引导,将会是一个非常大的隐患。这也要求政府和互联网企业做好舆情的监控和引导。这也是本系统分析设计的一个非常重要的原因之一,这个原因也是主要原因。
由于在互联网上发表言论的人,多是匿名的或半匿名(半匿名指发表言论者如果未主动透露自己的信息,普通网民无法知道发表言论者的真实身份,只能知道其昵称,但是施行互联网实名制的互联网平台方是能够知道的)的,所以这些言论更能表达言论者内心的真实想法,这比线下的民意调查要更加的有价值。这也是本设计本系统的另一个原因。
2. 研究的基本内容
本次设计分析并设计了一个针对哔哩哔哩弹幕网,基于爬虫的,面向开发者和研究人员的舆情信息采集系统。主要内容为开发运行环境的搭建与测试,需求及技术分析,系统详细设计及实施,最终总结。主要涉及到了以下几个计算机相关的领域:Web安全与测试,App安全与测试,Web开发,跨平台GUI开发,数据分析。涉及的技术更是有:正则表达式,爬虫及反爬虫(反反爬虫)技术,基于xml的GUI设计,中间人攻击,xpath等。
3. 实施方案、进度安排及预期效果
方案主要分为三步,即环境的部署,各模块的分析实施,最后的整合发布。
整个设计过程在一个月内完成。
1.第一周进行对国内外采集系统和爬虫的研究,总结和本次设计的目标和具体需求;
4. 参考文献
[2] myers d, mcguffee j w. choosing scrapy[m]. 2015.
[3] 陈利婷. 大数据时代的反爬虫技术[j]. 电脑与信息技术, 2016, 24(6):60-61,共2页.
最新文档
- 石榴物候期观测与春夏栽培技术开题报告
- 基于关键性影响因素的农村“煤改气”工程分析——以北京地区为例文献综述
- 酰基化黑米花色苷稳定性与抗氧化活性研究开题报告
- 应变片方位偏差对测量结果影响分析文献综述
- 海南省土壤环境功能区划研究开题报告
- 过去百年山西省耕地网格化重建研究文献综述
- 石蒜植物EST资源的SSR信息分析及EST-SSR标记开发开题报告
- 1979-2017年华北地区极端高温事件季节内尺度特征初探文献综述
- 磁化水对火炬松种子休眠解除的影响开题报告
- 酸雨对含磷物质钝化修复的农田土壤磷流失影响研究文献综述
- 甜橙油纳米乳液的制备及稳定性研究开题报告
- 基于单片机的温湿度实时测量系统文献综述
- 不同品种薄壳山核桃花粉形态特性的比较研究开题报告
- WRF模式边界层参数化方案对漳河流域一次降水模拟的影响研究文献综述
- 利用反向原子转移自由基聚合合成聚丙烯酸甲酯开题报告


