微博信息分析程序的设计与实现毕业论文

 2020-04-04 10:04

摘 要

在网络基础设施完善,移动设备高度普及的今天,言论的扩散传播不管是广度还是速度都发生了天翻地覆的变化。互联网平台上的舆情状况对整个社会的方方面面都有着深远的影响。而微博作为我们国家目前最为主流,最具影响力的网络舆论阵地,则是整个网络舆论的重要组成部分。它具有所有互联网平台的特点:消息传播直接,即时,迅速,且内容种类多样,具有极高的互动性。

论文主要研究了如何科学,高效,准确地从微博平台上抓取信息,对特定事件的舆论走向进行分析,从而对政府,品牌等的进一步决策提供辅助信息。

研究结果表明:对微博平台的舆论分析不仅需要结合传统舆论平台的分析方法,同时还需要考虑网络平台所具有的独有特质,在这些基础上,融合我们的技术手段,进行合理科学的开发。

本文的特色在于:以微博平台为研究考察对象,通过对微博平台的内容传播扩散机制的研究和微博平台上意见领袖的诞生和作用,为我们的舆情分析系统的产品设计提供需求分析以及功能设计的灵感。在确定了整体的功能架构之后,联系用户的使用场景和心理设计整个产品的使用流程,进而进行产品界面的设计。在具体的实现部分,将整个产品的实现工作拆分为四个最为关键的技术模块,灵活运用各种出色的技术完成它们的编码。在数据抓取部分,编写queryByKeyWord()方法,以用户在文本框的输入作为查询的关键词抓取微博数据。在数据的格式转换及存储部分,利用visual studio中的Newtonsoft工具帮助我们将返回的Json数据成功解析。在对微博内容的情感倾向分析部分,编写SentimentClassifier()方法将待分析的字符串作为参数,返回正向,负向或中性的情感倾向分析的结果。最后将这些结果以清晰直观易懂的方式展现在界面上供用户阅览。至此完成对整个产品的设计与实现。

关键词:微博;舆情分析;社交;

Abstract

With the improvement of network infrastructure and the popularity of mobile devices, the proliferation of speech has undergone tremendous changes both in breadth and speed. The public opinion situation on the Internet platform has a profound impact on all aspects of society as a whole. As the most mainstream and most influential network public opinion position in our country, Weibo is an important part of the entire network public opinion. It has all the characteristics of the Internet platform: the message is direct, instant, fast, and has a variety of content and high interaction.

This paper takes the Weibo platform as the research object, and through the research on the content dissemination and diffusion mechanism of the Weibo platform and the birth and role of opinion leaders on the Weibo platform, it provides the demand analysis and function for the product design of our public opinion analysis system. Inspiration for design. After determining the overall functional architecture, contact the user's usage scenario and mentally design the entire product use process, and then design the product interface. In the specific implementation part, the entire product implementation work is split into the four most critical technology modules, using a variety of outstanding technologies to complete their coding. In the data capture section, write the queryByKeyWord() method to capture the microblog data with the user's input in the text box as the keyword of the query. In the data format conversion and storage section, the Newtonsoft tool in visual studio was used to help us successfully parse the returned Json data. In the analysis of the sentiment orientation of the Weibo content, the SentimentClassifier() method is written to take the string to be analyzed as a parameter, and the result of a positive, negative, or neutral sentiment analysis is returned. Finally, these results are displayed on the interface for users to read in a clear and easy-to-understand manner. This completes the design and implementation of the entire product.

Key Words:weibo;socializing;tendency analysis;

目 录

摘要

Abstract

1 引言 1

1.1 项目背景 1

1.2 目的及意义 1

1.3 微博消息传播扩散机制 2

1.4 微博平台意见领袖 2

2 开发平台及环境 3

2.1 开发环境 Visual Studio 2015 3

2.2 开发语言C# 3

2.3 开发数据库Microsoft Sql Server 4

3 系统分析 5

3.1 可行性分析 5

3.1.1 经济可行性分析 5

3.1.2 技术可行性分析 5

3.1.3 社会可行性分析 6

3.1.4 可行性研究结论 6

3.2 需求分析 6

3.2.1 用户需求详细分析 6

3.2.2 功能模块分析 7

3.2.3 核心技术分析概述 7

4 系统设计 9

4.1 总体设计 9

4.1.1 输入关键词抓取微博信息并存储功能 9

4.1.2 输入关键词抓取微博信息并存储功能用例图 9

4.1.3 输入查询条件并阅览查询结果功能 10

4.1.4 输入查询条件并阅览查询结果功能用例图 10

4.2 详细设计 11

4.2.1 用户总体使用流程设计 11

4.2.2 界面设计 12

4.3 数据库设计 12

5 系统实现 13

5.1 界面实现 13

5.2 核心代码实现 14

5.2.1 数据抓取的技术实现 14

5.2.2 数据格式转换的技术实现 14

5.2.3 微博内容情感分析的技术实现 15

5.2.4 数据库及数据存储的技术实现 16

6 系统测试 18

6.1 系统测试概要 18

6.2 系统测试用例设计 18

7 结论与展望 20

7.1 项目成果与展望 20

7.2 收获 21

参考文献 21

致 谢 22

1 绪论

1.1 设计背景

由于微博的自由,开放,虚拟和隐蔽,以及言论的快速传播,使得以往在传统媒体中无法表达的个人表达自由和言论自由得到空前的发展,对社会生活各个方面产生了极大的影响,对微博信息进行监控和分析已经成为社会管理重大课题。截止至2017年12月,我国网民规模达7.72亿,全年共计新增网民4074万人。互联网普及率为55.8%,较2016年底提升2.6个百分点。截至2017年12月,我国手机网民规模达7.53亿,较2016年底增加5734万人。网民中使用手机上网人群的占比由2016年的95.1%提升至97.5%,网民手机上网比例继续攀升。尤其对于微博这样一个以随地随地分享身边的新鲜事为功能特色和产品特性,主打卖点的产品来说,用户使用的移动特性更加明显,同时由于使用的方便快捷,进一步增强了微博上信息传播的及时迅速以及言论传播的快速迅猛。

美国人Ev Williams作为twitter的联合创始人,率先把micro-blog这种社交媒体带到人们的日常生活当中。国内互联网界经过了多年的尝试,多种形态各异的同类产品都曾出现在市场上,最终新浪微博脱颖而出,成为如今国内唯一成功的同类产品。经过几年的发展,结合人们生活娱乐社交习惯的改变,微博逐渐成为国内最主流,同时影响力最大的舆论阵地。系统高效性与可靠性的是大势所趋。

1.2 目的与意义

所谓言论,是在一定时间空间内,围绕各种社会事件的产生,发展和变化,社会主体群众对事件本身及参与人员所持的态度,意见,情绪的总和。这些社会事件既可以小到用户本地所发生的一件趣事,也可以是品牌厂商精心策划的一次营销活动,更可以是政府的一项重要政策。通过对微博这个最重要的舆论平台上民众的观点分析,我们可以更加准确地把握大众态度,以辅助我们更好地进行后续决策。对于公司来说,对潜在顾客反响的分析可以更好地帮助公司评估营销效果,调整公司整体经营策略,塑造公司形象定位。对于政府来说,通过对民众言论的分析,可以更好地把握民生需求,了解民众想法,更好的优化调整政策,为大众服务,同时警惕不法分子通过网络传播不当言论,及时对这些违法行为进行处理。

综上所述,本项目的成功研发对社会上各个层面的组织机构都有着极大的实用意义。

1.3 微博消息传播扩散机制

微博作为我们国家最为重要的舆论阵地,发声平台,有着网络平台的基本特点:直接,即时,内容涵盖范围丰富,且互动性强。这一切的特性奠定了微博相比传统舆论阵地的优越性。事件发生后,网友会立刻接收到相关消息,进而发表自己的观点,其他用户看到之后随之与之产生互动。同时,网络本身的虚拟性使得用户几乎不用为自己发表的言论承担责任,因此进一步刺激了用户发言的踊跃程度,态度鲜明甚至是过激的言论可以迅速激起大量用户自发选择观点站队,这又再次激发了用户的使用动机。这一切的特性保证了微博对于用户来说超高的用户粘性,这种用户粘性也确保了微博作为国内主流舆论阵地的地位。

其次,微博也有着140字的文本限制。这意味着用户发表的内容都是及时的,碎片化的,易于了解,观点性质浓厚的,同时微博平台上的内容其原创性也远大于其他以长文为主的媒体平台,这意味着用户习惯在微博这个平台上发表自己的观点态度,并且浏览其他用户的观点,与之产生互动,作为解决自己情感发泄需求,自我满足感,以及交际需求的最主要手段。

我们如果想要对微博上的信息进行很好的管理和分析,了解并利用以上的特性是十分重要的。

1.4 微博平台意见领袖

意见领袖这个概念最开始产生于上个世纪的四十年代, 在1940年的美国总统选举期间,传媒学领域中的资深学者对媒介的传播效果进行了深入的研究,从而第一次将这个概念带到我们面前。在这次研究活动的过程当中,研究学者发现相当大部分的选民都将他们的选择构建在他们的亲人,朋友,周围邻居的选择之上,也就说,他们周围的这些意见领袖对他们的看法,观点,都有着非常深远的影响。在日常生活当中,这些意见领袖也会经常为他们周围的人提供评论,意见,观点,从而影响周围人的生活决策。

而意见领袖的概念在微博这个社交平台上也有了更为明晰的判断标准和直观体现。一个微博账号的粉丝数,每一条微博的点赞数,评论数,转发数,以及微博平台所提供的一些测评指标,如每周访客数,人气,所在领域排行榜等等,都可以为我们在定义意见领袖的时候提供非常清晰的指标作为辅助决策。

和日常生活当中一样,微博平台的意见领袖也对微博平台整体的舆论走向有着不可忽视的影响和决定性作用。对于一些社会性事件,那些积累了足够人气或社会影响力的公知大V对他们的看法,将会深刻的影响一大群公众对这件事件的观点,因此在我们对特定舆论进行分析的时候,我们也可以着重看重这些微博意见领袖的看法,通过对他们的言论进行分析,我们可以从比较宏观的角度来把握整体的舆论状况。在产品进行设计的时候,我们也可以注重将点赞数作为提取的字段信息之一 ,并考虑进一步将其作为提供给用户的筛选查询条件。

2 开发平台及环境

2.1 开发环境 Visual Studio 2015

Visual Studio 是一套基于组件的软件开发工具和其他技术,可用于构建功能强大、性能出众的应用程序。Visual Studio 2015内部代号为Visual Studio "14" ;Visual Studio "14" Community Technology Previews (CTP) 是 Visual Studio 下一主要版本的早期预发布版本,于2014年11月13日开放下载。

它有着许多非常方便且强大的功能。比如,它能够创建跨平台运行的ASP.NET 5网站(包括Windows、Linux和Mac);集成了对构建跨设备运行的应用的支持(通过整合Visual Studio Tools for Apache Cordova、以及用于跨平台库开发的全新Visual C 工具);连接服务(Connected Services)体验更加轻松(可方便地在app中集成Office 365、SalesForce和Azure平台服务);智能单元测试(Smart Unit Testing,原名为PEX):Visual Studio 2015已整合来自微软研究院的单元测试技术;全新的代码效率(得益于全新的.NET编译平台Roslyn)。  更优的代码编辑器。代码编辑器已经替换成“Roslyn”,将会给你带来不一样的代码编辑体验。当你要修复代码的时候,将会出现一个小灯泡,它会向你提供一系列修复代码的方案,你只需选择即可。

2.2 开发语言C#

C#是微软公司发布的一种面向对象的、运行于.NET Framework之上的高级程序设计语言。并定于在微软职业开发者论坛(PDC)上登台亮相。C#是微软公司研究员Anders Hejlsberg的最新成果。C#看起来与Java有着惊人的相似;它包括了诸如单一继承、接口、与Java几乎同样的语法和编译成中间代码再运行的过程。但是C#与Java有着明显的不同,它借鉴了Delphi的一个特点,与COM(组件对象模型)是直接集成的,而且它是微软公司 .NET windows网络框架的主角。

C#是一种安全的、稳定的、简单的、优雅的,由C和C 衍生出来的面向对象的编程语言。它在继承C和C 强大功能的同时去掉了一些它们的复杂特性(例如没有宏以及不允许多重继承)。C#综合了VB简单的可视化操作和C 的高运行效率,以其强大的操作能力、优雅的语法风格、创新的语言特性和便捷的面向组件编程的支持成为.NET开发的首选语言。 

C#是面向对象的编程语言。它使得程序员可以快速地编写各种基于MICROSOFT .NET平台的应用程序,MICROSOFT .NET提供了一系列的工具和服务来最大程度地开发利用计算与通讯领域。

C#使得C 程序员可以高效的开发程序,且因可调用由 C/C 编写的本机原生函数,因此绝不损失C/C 原有的强大的功能。因为这种继承关系,C#与C/C 具有极大的相似性,熟悉类似语言的开发者可以很快的转向C#。

2.3 开发数据库Microsoft Sql Server

SQL Server 是Microsoft 公司推出的关系型数据库管理系统。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行Microsoft Windows 98 的膝上型电脑到运行Microsoft Windows 2012 的大型多处理器的服务器等多种平台使用。

Microsoft SQL Server 是一个全面的数据库平台,使用集成的商业智能 (BI)工具提供了企业级的数据管理。Microsoft SQL Server 数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能,使您可以构建和管理用于业务的高可用和高性能的数据应用程序。

SQL Server 是一个关系数据库管理系统。它最初是由Microsoft、Sybase 和Ashton-Tate三家公司共同开发的,于1988 年推出了第一个OS/2版本。在Windows NT 推出后,Microsoft与Sybase 在SQL Server 的开发上就分道扬镳了,Microsoft 将SQL Server移植到Windows NT系统上,专注于开发推广SQL Server 的Windows NT 版本。Sybase 则较专注于SQL Server在UNⅨ操作系统上的应用。

SQL Server 2000 是Microsoft 公司推出的SQL Server数据库管理系统,该版本继承了SQL Server 7.0 版本的优点,同时又

比它增加了许多更先进的功能。具有使用方便可伸缩性好与相关软件集成程度高等优点,可跨越从运行Microsoft Windows 98 的膝上型电脑到运行Microsoft Windows 2000 的大型多处理器的服务器等多种平台使用。

3 系统分析

3.1 可行性分析

3.1.1经济可行性分析

在系统开销方面,包开发系统的支出主要包括系统的研发费用和系统的运行维护费用两部分,由于我们的项目完全采取独立自主开发,没有任何的外包或人员的聘请费用产生,所以在这一块的金额支出方面我们可以忽略不计。

您需要先支付 49元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找,微信号:bysjorg 、QQ号:3236353895;