基本文本挖掘的金融预测分析毕业论文

2021-05-13 23:54:24

摘要

随着信息化飞速发展人们日常生活中充斥着网络元素。现代人越来越倾向于在网络上发表自己的见解或分享自己的情绪，而新浪微博作为国内自媒体平台中的佼佼者，自然成为人们的首要选择。本文基于新浪微博文本进行金融预测分析，其意义在于微博文本中包含有大量金融、财经信息，其中一部分信息是十分明显的，并且可轻易进行分析，但另有大部分金融、财经信息是隐藏且不可轻易被发现的，如此一来，基于文本挖掘的金融预测分析就拥有着巨大的意义。

本文在文本挖掘中使用R语言的基于情感词典的情感分析来量化文本；在量化后，文本全部转换为模为情感倾向值的向量，然后本文利用台湾林智仁教授的libsvm工具包对该向量进行分析。首先将数据分为训练集和测试集，大概训练集和测试集的比例是4：1。然后通过训练集训练模型，并用测试集测试。Libsvm中用到的模型为支持向量模型，SVM表现出来的良好的性能使其自身成为多领域上的常客，如人脸识别、文本分类等。研究表明SVM的分类效果几乎要好过现有一切算法。由于其出色的学习能力，支持向量机技术已成为当前国际国内研究者的研究热点。

关键词：文本挖掘；金融预测；支持向量回归模型

Abstract

With the rapid development of information technology, people are full of network elements in their daily life. Modern people tend to express their opinions or share their emotions on the web. And micro-blog Sina as a leader in the domestic media platform naturally become the first choice of people. Based on the text of sina microblogging financial forecast and analysis, its significance lies in the microblogging text contains a large number of financial, financial information, including a part of the information is very obvious, and can be easily analyzed, but otherwise the majority of financial, financial information is hidden and can not easily be found. Thus, based on text mining financial forecasting analysis has great significance.

In this paper, in the text mining using R language used to analyze the quantitative text based on their emotional sentiment dictionary, for details, please refer to Chapter 3; in the quantized. All of the text conversion as a template for sentiment value vector, then the Taiwan Professor Lin Zhiren libsvm toolkit of the vector analysis. First, the data are divided into training set and test set. The ratio of training set and test set is 4:1. Then the training model is trained by the training set and the test set is used. Libsvm used in the model for the support vector model, SVM showed a good performance to make it become more frequent in the field of frequent, such as face recognition, text classification, etc.. Research shows that the classification effect of SVM is almost better than all existing algorithms. Because of its excellent learning ability, support vector machine technology has become the current international and domestic research focus.

Key words:Text mining; Financial forecast;Support vector regression model

第1章绪论 1

1.1 文本挖掘及金融预测分析的研究背景 1

1.2 文本挖掘及金融预测分析的国内外研究现状 2

1.2.1 文本挖掘的研究现状 2

1.2.2 金融预测分析的研究现状 3

1.3 本文的组织结构 4

第2章文本挖掘和金融预测的理论基础及其模型 6

2.1 有效市场假说理论和行为金融理论 6

2.2 文本挖掘相关理论基础及其模型 7

2.2.1 文本分类概述、模型及相关理论 7

2.2.2 文本挖掘模型及相关理论 8

2.3 金融预测相关理论基础及其模型 9

2.3.1 时间序列相关理论 9

2.3.2 支持向量机模型及其相关理论 10

2.4 本章小结 10

第3章文本挖掘研究方案 11

3.1 R语言及其程序包 11

3.1.1 R语言系统介绍 11

3.1.2 R语言程序包介绍 12

3.1.3 文本挖掘实现步骤概述 13

3.2 分词及词云 13

3.2.1 微博信息的获取 13

3.2.2 分词 15

3.2.3 词云 16

3.3 去除停用词和一些特殊符号 16

3.4 情感分析 17

3.5 本章小结 19

第4章金融预测分析研究方案 20

4.1 Libsvm工具包简介 20

4.2 模型的训练及测试 20

4.3 结果展示及分析 21

4.3 本章小结 26

第5章总结与展望 27

5.1 总结 27

5.2 展望 27

参考文献 28

致谢 29

第1章绪论

在信息化飞速发展的今天，人们日常生活中充斥着网络元素。现代人越来越倾向于在网络上发表自己的见解或分享自己的情绪，而新浪微博作为国内自媒体平台中的佼佼者，自然成为人们的首要选择。本文基于新浪微博文本进行金融预测分析，其意义在于微博文本中包含有大量金融、财经信息，其中一部分信息是十分明显的，并且可轻易进行分析，但另有大部分金融、财经信息是隐藏且不可轻易被发现的，如此一来，基于文本挖掘的金融预测分析就拥有着巨大的意义。

1.1 文本挖掘及金融预测分析的研究背景

文本数据挖掘（Text Mining），从某种意义上来说是数据挖掘技术的一个分支。数据挖掘技术是经历了不断演化和蜕变的。电子数据处理的前期，人们就希望机器能够自动进行决策，由此，机器学习就成为了人们关注的中心点。机器学习的过程就是指将一些已被解决的问题当作范例，使机器进行学习，从而达到生成相应规则的目的。这些规则具有某种普遍性，可以根据其范例的范围或领域而适用于相关的范围或领域。如此即可对一些在该范围内的新问题进行程序式地解决。

随后，随着人工神经网络技术的产生和发展，人们将其注意力转向了知识工程。知识工程不同于机器学习的根据已有事例形成简单规则的方式，其直接将已经代码化的规则输入到机器里面，并通过使用这些规则来解决问题。

您需要先支付 80元 才能查看全部内容！立即支付

注册

找回密码

基本文本挖掘的金融预测分析毕业论文

1.1 文本挖掘及金融预测分析的研究背景

您可能感兴趣的文章

最新文档

推荐栏目

登录

注册

找回密码

基本文本挖掘的金融预测分析毕业论文

1.1 文本挖掘及金融预测分析的研究背景

您可能感兴趣的文章

最新文档

推荐栏目