登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

面向在线直播弹幕的情感分析毕业论文

 2021-12-06 08:12  

论文总字数:25029字

摘 要

近年来,网络在线直播在不断发展之中,越来越多的网络用户观看网络在线直播,加入到了观看直播的群体中。斗鱼、虎牙等网络直播平台日益兴起,成为了许多年轻人日常生活的重要组成部分。而直播平台中主播与观众、观众与观众之间重要的交互方式就是直播弹幕。正向的弹幕能够提升观众的观看体验,促进主播与观众之间的互动交流,而负向的弹幕则会给主播和观众造成困扰,甚至进一步造成不好的影响。因此,面向在线直播弹幕的情感分析对于直播平台管理直播间尤为重要。本文采用深度学习的方法来研究在线直播弹幕的情感分析。具体研究内容如下:

实验中采用网上开源的工具爬取直播弹幕,调用情感倾向分析api给弹幕打上标签,以此获取到了数据集。同时,为了更好的解决在线直播弹幕的情感分析问题,本文采用word2vec预训练好的词向量嵌入三种不同的模型进行实验,分别为卷积神经网络(CNN)、循环神经网络(RNN)还有长短期记忆网络(LSTM)。经过对比后的实验结果表明,卷积神经网络的F1分数最高,为0.8164,在处理在线直播弹幕的情感分析问题上有更好的效果。最后运用实验得到的模型,设计了情感倾向分析和模拟管理界面,为直播平台管理直播内容提供了一个思路。

关键词:弹幕;情感分析;CNN;RNN;LSTM

Abstract

In recent years, online live broadcasting has been constantly developing. More and more network users have watched online live broadcasting and joined the group watching live broadcasting.Online live broadcast platforms such as Douyu and Huya are rising day by day and have become an important part of daily life for many young people. The important interaction method between the anchor and the audience and the audience and the audience in the live broadcast platform is the live broadcast barrage. The positive barrage can enhance the viewing experience of the audience and promote the interaction between the anchor and the audience, while the negative barrage will cause trouble to the anchor and the audience, and even further cause a bad impact. Therefore, sentiment analysis for online live barrage is particularly important for live broadcast platforms to manage live rooms. This thesis uses deep learning methods to study sentiment analysis of online live barrage. The specific research content is as follows:

In the experiment, the online open source tool was used to crawl the live barrage, and the sentiment analysis API was used to tag the barrage to obtain the data set. At the same time, in order to better solve the sentiment analysis problem of online live barrage, this thesis uses word2vec pre-trained word vectors to embed three different models for experiments, namely convolutional neural network(CNN), recurrent neural network(RNN) and long-short-term memory network(LSTM). The experimental results after comparison show that the F1 score of the convolutional neural network is the highest, which is 0.8164, which has a better effect on the sentiment analysis of online live barrage. Finally, using the model obtained from the experiment, the emotional tendency analysis and simulation management interface are designed, which provides an idea for the live broadcast platform to manage the live content.

Key Words: Barrage; sentiment analysis; CNN; RNN; LSTM

目 录

第1章 绪论 1

1.1 课题研究背景及意义 1

1.2 国内外研究现状 2

1.3 论文研究内容 3

1.4 论文组织结构 3

第2章 相关技术介绍 5

2.1 实验相关的库 5

2.2 分词工具介绍 5

2.3 词向量相关介绍 6

2.3.1 词向量 6

2.3.2 Word2vec 7

2.4 评价指标 9

2.5 数据预处理 10

2.5.1 数据集的制作 10

2.5.2 分词及停用词标点符号处理 12

2.5.3 词向量训练 13

2.5.4 数据集的划分 14

2.6 本章小结 14

第3章 神经网络模型介绍 16

3.1 卷积神经网络 16

3.2 循环神经网络 16

3.3 长短期记忆网络 18

3.4 本章小结 19

第4章 实验设计与结果分析 20

4.1 实验模型结构 20

4.1.1 卷积神经网络模型结构 20

4.1.2 循环神经网络模型结构 21

4.1.3 长短期记忆网络模型结构 21

4.2 实验参数设置 22

4.2.1 词向量参数设置 22

4.2.2 输入层参数设置 22

4.2.3 神经网络层参数设置 22

4.2.4 输出层的参数设置 24

4.3 实验结果 24

4.3.1 卷积神经网络实验结果 24

4.3.2 循环神经网络实验结果 26

4.3.3 长短期记忆网络实验结果 28

4.3.4 实验小结 30

4.4 本章小结 31

第5章 界面设计 32

5.1 界面设计相关内容 32

5.2 界面具体设计 32

5.2.1 弹幕情感分析界面 32

5.2.2 模拟管理界面 33

5.3 界面展示 34

5.3.1 弹幕情感分析界面展示 34

5.3.2 模拟管理界面展示 36

5.4 本章小结 37

第6章 总结与展望 38

6.1 总结 38

6.2 展望 38

参考文献 40

致谢 41

第1章 绪论

1.1 课题研究背景及意义

网络直播具有着直观、快速还有交互性较强的特点,同时网络直播还不受地域的限制,直播观众也能够随时随地的观看直播,网络直播因此还收到了不错的效果。随着直播平台的日益兴起,越来越多的网民加入到了网络直播的群体中。

2020年4月28日,中国互联网信息中心(CNNIC)发布第45次《中国互联网络发展状况统计报告》[1]。根据该报告,截至到2020年3月,中国网络直播用户量已经达到5.6亿,比2018年底增加了1.63亿,占网民总数的62.0%。

图1.1 2016.12-2020.3网络直播用户规模及使用率

随着越来越多的网民加入到网络直播,弹幕成为了主播与观众、观众与观众之间重要的交互方式。主播在进行直播内容时观看弹幕已经成为了直播的常态。在斗鱼、虎牙等直播平台中,游戏主播可以通过弹幕与观众进行交流游戏内容,观众也可以利用弹幕对主播进行指导。在淘宝等平台的带货直播中,观众可以利用弹幕对主播提出自己的问题,主播因此也可以对问题进行解答,以便更好的带货。弹幕已经成为了直播不可缺少的一部分,成为了重要的交互方式。

斗鱼、虎牙等直播平台都有超级管理员的存在,简称“超管”。他们的任务是负责管理直播间,看看是否出现违规的行为。如果有,则加以提示。如果有更为恶劣的行为,超管则可以直接封掉直播间。而作为超管,可能负责管理着几个、十几个甚至几十个直播间,他们不停的负责每个直播间的巡查,这样消耗了大量的人力。

弹幕作为一种重要的交互方式,在一定程度上可以反应出主播的直播内容质量。当主播直播内容较好,直播间的弹幕一般为正向弹幕占多数。而当一个直播间的弹幕组成中,负向弹幕占大多数,则说明主播或者直播内容等出现了问题,这时候就需要超管去管理直播间。

通过对直播间的弹幕进行情感分析,如果正向弹幕占绝大多数,那么这个直播间的直播内容较好,不需要超管过多管理。而如果负向弹幕占绝大多数,则说明直播间主播或者直播内容等出现了问题,这时候就可以提示超管去管理。因此,直播平台可以利用情感分析技术,帮助超管更好的定位那些具有违规行为的主播,这样可以节省一定的人力。因此,面向在线直播弹幕的情感分析具有重要的意义。

1.2 国内外研究现状

自然语言处理一直是深度学习的一个热门方向,而情感分析等文本分类问题也一直受到国内外诸多人的研究。

在国外,2017年,Yang Li[2]等人在已有的情感词典中词的值的基础上进行了情感分析的研究,找到了能够合并这些已有的情感信息的最佳方法,可以显著提高情感分析的性能。2018年,Amir Hussain[3]等人提出了一种新型半监督学习模型来进行情感的极性检测。同年,Mauro Dragoni[4]等人提出了一个情感分析模型,可以将情感值与定义好的概念或者词嵌入等外部信息结合起来,进行情感分析。Haiyun Peng[5]等人在部首、字、单词三个粒度方面进行了情感分类的研究。

在国内,2017年,李超[6]改进传统的卷积神经网络模型,同时结合长短期记忆网络模型进行文本分类。2018年,庄须强[7]利用LSTM神经网络处理弹幕评论。同年,何明[8]提出了一个深度混合模型用于给有丰富的主观情绪的弹幕相关联的图像分类。洪庆[9]等人通过改进传统的聚类算法,基于情感值对发表弹幕的用户进行了分类。方祥辉[10]通过词语、短语、句子多个粒度来判断文本的情感极性。禹业藂[11]采用了双向LSTM充分利用上下文信息,同时构建了主题级别的情感分析模型,从多个角度进行情感倾向分析。

2019年,段炼[12]对比传统的情感词典构建方式,提出了改进的基于词向量的情感词典构建方法,同时利用情绪衰减模型改进了弹幕文本的情感计算方法。同年,张林[13]采用基本神经网络模型,设置神经网络参数得到了所用数据集的最佳文本分类模型。季立堃[14]构建了一种情感分析模型,是基于多头自注意力机制,在情感分析任务上得到了提升。范文慧[15]提出了融合卷积神经网络和循环神经网络的情感分析模型用于网络舆情文本的情感分类。叶健[16]等人提出了基于卷积神经网络的情感褒贬分类模型,用于弹幕的情感倾向的正负分析。王瑞东[17]提出了一种结合弹幕文本和视频人脸图像的多模态情感分析算法。

请支付后下载全文,论文总字数:25029字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图