登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 理工学类 > 统计学 > 正文

聚类分析在股票市场板块中的应用研究

 2023-07-07 08:07  

论文总字数:11418字

摘 要

在统计学的研究领域中,聚类分析法是一种常用的数据分析法. 本文用系统聚类法对股票的银行板块进行研究,利用已知数据对于该类股票的各项指标综合分析,以此反映出银行的盈利能力和发展水平,评估优劣以减少投资风险.

关键词:聚类分析,银行,股票市场

Abstract: In the field of Statistics, cluster analysis method is widely used in analyzing data. In the following thesis, I will use hierarchical clustering method to research bank stock. By using the data we have already known to analyze the stock, we can know the profitability and development of the bank. We can also assess the pros and cons to reduce investment risk.

Keywords: cluster analysis, bank, stock market

目 录

1引言 4

1. 1研究背景 4

1. 2聚类分析法概述 4

1. 3本文的主要工作 6

2实证分析 7

2. 1数据选取 7

2. 2聚类结果 8

2. 3具体分析 10

3对比及建议 12

结论 14

参考文献 15

致谢 16

1 引言

在中国市场经济飞速发展的今天,人们的金融意识和投资意识逐渐增强. 股票市场作为市场经济的组成部分,正在逐步走向成熟与规范. 投资者们逐渐把眼光投向了股票,股票不仅在过去提供投资者可观的长期利益,同时在将来也将提供良好的机遇. 理性的投资者们会更加重视股票所在公司的经营业绩以及股票的内在价值. 因此,对于股票价值的评价尤为重要.

股票投资的基本分析分为宏观分析、中观分析和微观分析. 随着中国股市的迅猛发展,同时上市公司也不断增多,所以要理性地分析各项股票. 在成熟的股市中,股民们成功的捷径就是股票分析,理性操作,梳理板块投资理念. 本文运用聚类分析法对股票市场板块进行分析分类研究,比较各类股票,从而使投资者便于选择,减少投资风险.

    1. 研究背景

股票市场也称为二级市场或次级市场,是股票发行和流通的场所,也可以说是指对已发行的股票进行买卖和转让的场所. 股票的交易都是通过股票市场来实现的.

股票板块指的是这样一些股票组成的群体,这些股票因为有某一共同特征而被人为地归类在一起,而这一特征往往是被所谓股市庄家用来进行炒作的题材. 股票板块的分类特征有地理上的,例如“北京板块”、“上海板块”等;有业绩上的,如“绩优板块”等;有上市公司经营行为方面的,如“购并板块”等;还有行业分类方面的,如“钢铁板块”、“科技板块”、“金融板块”等等. 在中国股市中,最常见的板块是分为A股、B股、H股、中小板、创业板等.

    1. 聚类分析法概述

聚类分析法是一种常用的解决问题的方法. 聚类分析将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强. 其目的在于使类间对象的同质性最大化和类与类间对象的异质性最大化. 聚类分析的职能是建立一种分类方法,它是将一批样本或变量,按照他们在性质上的亲疏程度进行分类.

聚类分析不仅可以用来对样本进行分类(型聚类分析),也可以用来对变量进行分类(型聚类分析). 聚类分析从数据出发,将样品(指标)分类.

表1 数据矩阵

No.

···

1

2

·

·

·

···

···

· · ·

· · ·

· · ·

···

根据表1的数据矩阵,用表示第个样品的第个指标,第个指标的均值和标准差记作和,用表示第个样品和第个样品之间的距离. 最常见、最直观的距离为:

=,

前者称为绝对值距离,后者称为欧氏距离,这两个距离统一成明考斯基距离:

当=1和2时就是上述的两个距离,当趋于无穷时,为切比雪夫距离:

验证可得,满足距离的四条公理.

在实际中应用中的缺点如距离的大小与各项指标的观测单位有关,具有一定的人为性;另一方面,没有考虑指标之间的相关性. 通常改进的办法有下面两种:

(1)当各指标的测量值相差较大时,先对数据标准化,然后用标准化后的数据计算距离. 此时可以得出由兰斯(Lance)和威廉姆斯(Williams)最早提出的兰氏距离:

这个距离有助于克服的第一个缺点,但没有考虑指标的相关性.

(2)一种改进的距离是马氏距离:

式中,表示矩阵行向量的转置;是数据矩阵的协方差阵. 可以表明,它对一切的线性变换是不变的,故它不受指标量纲的影响.

聚类分析大致可以分为系统聚类法,模糊聚类法,-均值法分解法以及加入法这五种聚类方法. 下面我们来具体研究系统聚类法.

系统聚类法是一种将个样品分成若干类的方法,其基本思想是:先将个样品各看成一类,然后规定类与类之间的距离,选择距离最小的一对合并成新的一类,计算新类与其他类之间的距离,再将距离最近的两类合并,这样每次减少一类,直至所有的样品合为一类为止. 最后绘制聚类谱系图,按不同的分类标准或不同的分类原则,得出不同的分类结果. 凡是具有数值特征的变量和样品都可以采用系统聚类方法,选择不同的距离和分类方法可以获得满意的数值分类效果.

凡是具有数值特征的变量和样品都可以采用系统聚类方法,选择不同的距离和聚类方法可以获得满意的是指分类结果.

最短距离法就是把一个类的所有样品与另一个类的所有样品的两两样品之间的最短距离找出来,并将其定义为两个类之间的距离.

类与类之间的距离:

剩余内容已隐藏,请支付后下载全文,论文总字数:11418字

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图