针对哔哩哔哩弹幕网的舆情信息采集系统的分析与设计开题报告
2022-01-14 09:01
全文总字数:2748字
1. 研究目的与意义及国内外研究现状
随着互联网使用人数的不断增多,更多的人可以在互联网的平台上发表他们的评论,这些评论可能包括对某一事物的喜好,对某一时事的评讨,对某个知识的讲解或解释,当然还有可能会有居心叵测的人发表煽动人心的言论。无论这些言论价值观是普世的还是负面的,随着数量的增多,如果不能合理的对其分析和引导,将会是一个非常大的隐患。这也要求政府和互联网企业做好舆情的监控和引导。这也是本系统分析设计的一个非常重要的原因之一,这个原因也是主要原因。
由于在互联网上发表言论的人,多是匿名的或半匿名(半匿名指发表言论者如果未主动透露自己的信息,普通网民无法知道发表言论者的真实身份,只能知道其昵称,但是施行互联网实名制的互联网平台方是能够知道的)的,所以这些言论更能表达言论者内心的真实想法,这比线下的民意调查要更加的有价值。这也是本设计本系统的另一个原因。
2. 研究的基本内容
本次设计分析并设计了一个针对哔哩哔哩弹幕网,基于爬虫的,面向开发者和研究人员的舆情信息采集系统。主要内容为开发运行环境的搭建与测试,需求及技术分析,系统详细设计及实施,最终总结。主要涉及到了以下几个计算机相关的领域:Web安全与测试,App安全与测试,Web开发,跨平台GUI开发,数据分析。涉及的技术更是有:正则表达式,爬虫及反爬虫(反反爬虫)技术,基于xml的GUI设计,中间人攻击,xpath等。
3. 实施方案、进度安排及预期效果
方案主要分为三步,即环境的部署,各模块的分析实施,最后的整合发布。
整个设计过程在一个月内完成。
1.第一周进行对国内外采集系统和爬虫的研究,总结和本次设计的目标和具体需求;
4. 参考文献
[2] myers d, mcguffee j w. choosing scrapy[m]. 2015.
[3] 陈利婷. 大数据时代的反爬虫技术[j]. 电脑与信息技术, 2016, 24(6):60-61,共2页.
最新文档
- 基于深度学习卷积神经网络的智能垃圾分类系统外文翻译资料
- 有可接受的玻璃化转变温度、可加工性和阻燃性的厚朴酚基生物环氧树脂外文翻译资料
- 弱氢键使水凝胶坚硬、坚固、坚韧、富有弹性外文翻译资料
- 将高度膨胀的聚电解质水凝胶可逆地转变为极其坚硬的水凝胶 并将其应用为管状抓握器外文翻译资料
- 基于STM32的大学课堂考勤系统外文翻译资料
- Pt1/FeOx Pt1/FeOx单原子共氧化催化外文翻译资料
- 一种基于水凝胶电解质的多功能柔性可穿戴超级电容器外文翻译资料
- 无异箐酸酯途径由聚甘油五元环聚碳酸酯合成聚氨酯外文翻译资料
- 用于柔性和耐用超级电容器的机械增强自愈聚电解质外文翻译资料
- 将经验反馈集成到产品生命周期中: 一种对投标过程做出最佳响应的方法外文翻译资料
- 直接与互动营销策略与整合营销传播外文翻译资料
- 客户关系管理实施的影响关于服务运营管理外文翻译资料
- MXene TiC:一种有效的2D光热转换材料外文翻译资料
- 仙人掌果肉中的倍他青色素外文翻译资料
- 中国体育用品企业网络M营销定价策略研究外文翻译资料