基于网络社交平台的情感数据抓取与分析开题报告

 2022-01-09 10:01

全文总字数:1691字

1. 研究目的与意义及国内外研究现状

近些年来,各种网络社交平台成为人们进行交流的重要途径,在这些平台中,用户可以自己创作内容,表达观点和情绪。基于社交网络的情感分析也成为了当下的一个热点。

情感分析作为一项研究领域与网络数据爬取、计算机语言学、自然语言处理和文本挖掘息息相关,常见的“意见挖掘”、“主观性分析”和“评价性提取”便是“情感分析”。情感分析是对文本中的意见、感受和主观性的自动提取,它的突然流行给个人和公司带来了机遇和威胁,接收并学会利用它的主体将会从中大大受益。

情感分析要回答“人们对某一问题感受如何”的问题,因此需要庞大的意见库,我们需要借助爬虫来获取所需数据。网络爬虫是一个自动提取网页的程序,针对不同的业务需求会有不同的数据爬取策略。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究的基本内容

本选题预期实现从情感数据的提取、处理到分析的整个流程,主要内容包括:

(1)熟悉网络爬虫涉及的基础知识并运用;

具体为:网络协议,常见反爬虫机制,网络爬虫策略及优化等。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 实施方案、进度安排及预期效果

本选题的实施方案和进度安排如下:

(1)2018年1月

针对python相关语法,网络爬虫的基础知识,分布式爬虫框架scrapy和情感分析策略进行系统研究和学习,并实现初步数据爬取。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]christensen w,suess r.hobbyist computerizedbulletin board.byte magazine,1978

[2]chen h,zimbra d.ai and opinionmining.intelligent systems,ieee,2010

[3]陈晓东,基于情感词典的中文微博情感倾向分析研究. 华中科技大学,2012

剩余内容已隐藏,您需要先支付 5元 才能查看该篇文章全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。