登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 软件工程 > 正文

基于人工智能的足球联赛赛果预测方法研究毕业论文

 2021-12-06 08:12  

论文总字数:21710字

摘 要

足球运动一直以来深受广大球迷喜爱,是世界第一运动,足球比赛结果具有不确定性,足球也因此更具有魅力。近年足球博彩业的市场在国内受到了很大的刺激,市场规模越来越大,市场价值也不断上升,足球博彩行业十分需要一个科学有效的方案,需要通过数据挖掘技术、智能分析技术等技术来分析以往已有的足球历史数据,来对未进行的足球比赛的赛果进行一个预测。本次的研究旨在为足球彩票经营者提供一些有效的预测方法和具体实施方案,将人工智能与传统行业相结合,利用人工智能及机器学习相关技术来实现足球联赛中对未进行比赛的赛果进行预测。

本文使用了监督学习算法,对足球联赛赛果预测进行了相关研究。使用的数据集为英超足球比赛的相关数据,对英超十多年以来的统计数据进行了处理和分析,通过对历史比赛信息的数据挖掘对未进行的比赛的赛果进行了胜负预测。难点问题在于数据的处理、特征的选择构建和如何实现模型效果的提升。数据处理方法建立在对足球规则的了解之上,特征的选择参考了国内外研究的经验和总结。多次调参和预测尝试后使使用的几种模型的预测效果都得到了提升,主要使用的模型是监督学习中的逻辑回归、SVM等几种分类模型。研究中最好一次预测表现达到了64.57%的精确度。

关键词:机器学习;数据挖掘;赛果预测;

Abstract

The majority of fans are interested in football. Football is the world's first sport, and the results of football matches are uncertain, which make football more attractive to persons In recent years, the market of the football betting industry has been greatly stimulated in China. The market size is getting larger and larger, and the market value is also rising. The football betting industry needs a scientific and effective solution. Analyze the historical data of football in the past to make a prediction of the results of unplayed football matches. This research aims to provide football lottery operators with some effective prediction methods and specific implementation schemes, combining artificial intelligence with traditional industries, and using artificial intelligence and machine learning related technologies to achieve unmatched matches in football leagues. Making predictions is the focus of this study.

This thesis uses machine learning methods to conduct relevant research on the prediction of football league results. The data set used is the relevant data of the English Premier League football game. It has processed and analyzed the statistical data of the English Premier League for more than a decade. Through the data mining of historical game information, the results of the unplayed games are predicted. The difficult problem lies in data processing, feature selection and model improvement. The data processing method is based on the understanding of football rules, and the selection of features refers to the experience and summary of domestic and foreign research. After several attempts at parameter adjustment and prediction, the prediction effects of several models used have been improved. Several classification models were used.The best prediction performance reached 64.57% accuracy.

Key Words: machine learning; data mining; results prediction

目录

摘要 3

Abstract 4

第1章 绪论 7

1.1 课题背景及意义 7

1.2 国内外研究现状 7

1.3 论文研究内容 9

1.4 论文组织结构 9

第2章 数据获取与处理 11

2.1 实验相关的库 11

2.2 数据的获取与读取 11

2.2.1 数据集 11

2.2.2 数据读取 12

2.3 数据预处理 14

2.3.1 数据预处理介绍 14

2.3.2 数据清洗与预处理 15

2.4 特征工程 16

2.4.1 特征构造 16

2.4.2 特征处理 18

2.4.3 数据归一化 19

2.5 数据切分 20

第3章 监督学习模型介绍 21

3.1 逻辑回归模型(LR) 21

3.1.1 函数模型(sigmoid函数) 21

3.1.2 损失函数 21

3.1.3 优化方法 22

3.2 支持向量机(SVM) 22

3.2.1最优间隔分类器 22

3.2.2 模型修正 23

3.2.3 核函数 23

3.3 XGBoost模型 24

3.3.1 GBDT算法原理 24

3.3.2 XGBoost的改进 24

3.3.3 XGBoost快速高效的原因 24

3.4 本章小结 25

第4章 实验设计与结果分析 26

4.1 逻辑回归模型实验 26

4.1.1 实验参数设置 26

4.1.2 实验结果 26

4.2 支持向量机模型实验 27

4.2.1 实验参数设置 27

4.2.2 实验结果 28

4.3 XGBoost模型实验 28

4.3.1 实验参数设置 28

4.3.2 实验结果 29

4.4 超参数调整 29

4.5 预测赛果 30

4.6 结果分析 30

4.7 本章小结 32

第5章 总结与展望 33

5.1 总结 33

5.2 展望 33

参考文献 34

致谢 35

第1章 绪论

1.1 课题背景及意义

如今,足球是世界上生产力最高的户外运动,足球的产值之高和影响力之大众所周知。据有关统计,足球行业年工业产值达5000亿美元,在体育产业总产值中占比几乎达到一半,毋庸置疑,世界第一体育项目就是足球。篮球,棒球或一级方程式等其他任何体育项目的影响力都远远比不上足球。根据国际足联的统计,如今有至少三千万人参与足球有关的工作。据统计,世界人口的约3%的人都在从事着足球和相关的工作。国家足球相关会议审议重要提出了足球建设,旨在为足球发展建立一套标准模型。中期目标是不断增加中国年轻足球运动员的数量。中国职业联赛的比赛水平应该在亚洲达到一流,而国家女子足球队则回到世界一流的水平。长期目标是增加中国足球在全球足球舞台上的影响力,并成功申办世界杯。

如今,随着生活水平的一直提高,与体育相关的业务也在稳步增长。体育彩票作为体育相关产业之一引起了公众的广泛关注。世界各国都在使用足球彩票作为获得体育福利基金的快捷有效方式之一。在上世纪末,据数据显示,来自足球彩票的收入为英国,西班牙和德国等发达欧洲国家体育产业带来了四分之一经费支持。在亚洲也有一些国家足球联赛,例如韩国K联赛和日本J联赛,它们也会发行足球彩票。

随着人工智能的飞速发展,如何建立一种预测模型来预测足球比赛的结果并利用科学方法解决该预测问题引起专业人士和学者的极大兴趣。不同类型的足球比赛在某些方面具有明显的相似性。从理论上讲,可以在许多足球比赛中找到这些共性,并找到提高预测水平的方法。另一方面,可以宣传足球运动文化。

1.2 国内外研究现状

随着人工智能技术的不断发展,相关研究学者越来越重视许多理论和相关技术的应用。机器学习技术是人工智能中最重要的技术。祁航[1]利用了fisher判别法和bayes判别法建立了函数,可以用于网球比赛结果的判别,通过挖掘分析和交叉验证,结果显示判别成功率达到了95.5%。夏飞等[2]建立了BP神经网络模型预测中超比赛赛果,此研究的预测精度达到了66.5%, 对BP算法在预测应用当中的适用性做出了很好的总结,很好的体现出了BP神经网络在这种预测领域的应用的可靠性。

在进行足球联赛赛果预测时,影响赛果的可能会是根本没想到的外界因素,这也应当列入考虑范围之内,田岭[3]分析了项目革新、胜负确定方式、竞赛的制度、竞赛的奖励方式等等可能会对运动比赛的赛果造成影响,并且给出了各种影响因素的分析,这些都可以借鉴于足球联赛的赛果分析当中,给足球制胜因素的选择带来更多可能。

除此之外,刘乐等[4]研究了足球比赛数据研究的起源,他们以中超足球联赛为例,对当今比较先进和大量被应用的采集与分析技术现状进行了相关的研究,调研了相关科技公司的先进技术,这对于足球比赛的数据采集和分析的未来探索是宝贵的经验,同时为足球科研水平提高和中国的足球超级联赛竞赛水平发展起到了积极的作用。卞捷[5]预测了NBA赛果,使用的是结构自适应的BP神经网络,最终预测准确率提高至了66%。特征数众多时,需要有选择的忽略其中的某些数据,得到高预测准确率的结果,除此之外,研究者还通过实验证明了增加更多最近时间输入数据可以有效提高预测的正确率。

在足球运动中,运动员是很重要的角色,足球运动员的身体状况,比赛时的运动状态,是否有伤病,跑动距离以及体能消耗…这些都是会直接影响足球比赛赛果的重要因素,但这些数据很难在赛果预测中发挥出作用,刘勃[6]针对运动员的跑动和状态数据,在体能类指标的视角分析研究了足球比赛的制胜因素。李强[7]构造出了针对NBA比赛的球队排名的TeamRank算法,模型有着很好的预测效果,最好的情况达到了72.6%的准确率。德国的相关学者,约根·格哈茨等[8]研究了足球运动和球队的构成的组成结构,研究了与足球成功相关的重要因素,包括市场价值、队内不平等、队内文化多样性、队内的成员流动等等,然后得出了足球队伍在本地的联赛中的成功的高度预测性的结论,分析出了顶级欧洲足球联赛结果的预测因子的分析。朱文福[9]提出了KDD技术,应用KDD建模可以制定一种比赛的情况分析,并能对最后的比赛结果进行出预测,此项研究可用于足球比赛赛果预测中的制胜因子的判断和选择。足球的核心制胜因素和制胜公式探讨已被侯会生[10]有过研究,最后的结论是进攻指标,防守指标,裁判执法指标和体能指标等等15项指标都有显著影响。研究足球的联赛赛果很大的原因在于足球体彩的市场价值很大,赵啸宇、刘宇等[11][12]进行了足球彩票的盘路分析和数据的管理的研究,对足球彩票价格数据进行了分析、分类,以情报学为理论作为支撑,对足球竞赛现状进行了全面系统的分析和研究。

在国外,Leonardo Egidi等 [13]开发了一个分层贝叶斯泊松模型,分析了欧洲最受欢迎的联赛的九年数据集,以此来预测其第十个赛季的比赛结果。Byungho Min等[14]实现了一个称为FRES(足球结果专家系统)的足球结果预测器,并研究后给出了合理而稳定的预测。Md. Ashiqur Rahman [15] 通过深度神经网络(DNN)和人工神经网络(ANN)开发了一种有效的框架,用于预测足球比赛的结果。

请支付后下载全文,论文总字数:21710字

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图