登录

  • 登录
  • 忘记密码?点击找回

注册

  • 获取手机验证码 60
  • 注册

找回密码

  • 获取手机验证码60
  • 找回
毕业论文网 > 毕业论文 > 计算机类 > 计算机科学与技术 > 正文

公交线路客流预测系统的设计与实现毕业论文

 2020-02-16 10:02  

摘 要

由于目前国内城市交通拥堵问题的严峻性,大力发展公共交通出行成为一个非常重要的手段。为了对公交车辆出行调度与公交线路的合理规划,需要对公交线路客流量进行紧密细致的分析和正确精准的预测。本文将研究的重心放在公交线路的客流量预测上,实现公交线路客流量的预测,将有助于有关工作人员完成对城市交通调度和线路规划,从而缓解现有的城市交通拥堵问题。

本文是通过对某市公交线路的乘客刷卡数据记录进行研究,分析公交客流影响因素与选取特征,针对同一问题建立不同的预测模型,预测一周时间内公交线路的客流量,并对预测结果进行对比与讨论。

本文的主要工作包含以下几点:

第一点,公交线路客流数据处理。对公交客流数据进行预处理,充分理解数据内容,并对数据内容中存在的异常与缺失情况进行处理;然后挖掘数据中的时间分布特征与影响因素,包括天气、气温、风力、节假日等。通过引入皮尔森相关系数(Pearson)研究影响因素与客流量之间的关联程度;选取合适的客流特征,开始对原始数据集进行处理,生成合适的训练集与测试集。

第二点,公交线路客流预测。针对不同模型对训练集与测试集进行独热码与特征标准化操作。再基于线性回归、决策树、梯度提升决策树(GBDT)、极端梯度提升(XGBoost)、Light梯度提升机(LightGBM)这五种模型开始进行训练,通过引入学习曲线判断模型训练状态,并在训练过程中分析解决出现的问题。最终使用模型进行预测,得到预测结果。

第三点,预测结果分析。采用均方误差、均值绝对误差和预测偏差这三种指标对这五种模型预测结果进行分析讨论,并对预测结果与真实数据进行绘图对比,从中选择最合适的预测模型。

实验结果表明,在使用多种预测模型对公交线路客流进行预测研究后,LightGBM模型在均方误差、均值绝对误差与预测偏差方面的表现均为最佳,预测结果与其他模型相比保证了预测的精度,通过对比在五种模型中选择LightGBM模型作为本文最合适的预测模型。

关键词公交客流预测;线性回归;决策树;GBDT;XGBoost;LightGBM

Abstract

Due to the current serious problem of urban traffic congestion in China, vigorously developing public transportation has become a very important means. In order to make reasonable arrangements for bus travel scheduling and bus routes, it need to conduct detailed analysis and accurate prediction of bus line passenger flow.

This paper studies the passengers' credit card data records of a city bus line, analyzes the influencing factors and selection characteristics of bus passenger flow, establishes different forecasting models for the same problem, predicts the passenger flow of the bus line within one week, and compares the forecast results and discussion.

The main work of this paper includes the following points:

The first point is the passenger line data processing of the bus line. Pre-process the bus passenger flow data, fully understand the data content, and deal with the abnormalities and missing situations in the data content; then mine the time distribution characteristics and influencing factors in the data, including weather, temperature, wind, and holidays. By introducing Pearson correlation coefficient (Pearson) to study the degree of correlation between influencing factors and passenger flow; select appropriate passenger flow characteristics, start processing the original data set, and generate appropriate training sets and test sets.

The second point is the passenger flow forecast of bus lines. The one-hot encoding and feature standardization operation are performed on the training set and the test set for different models. Based on linear regression, decision tree, Gradient Boosting Decision Tree (GBDT), eXtreme Gradient Boosting (XGBoost), and Light Gradient Boosting Machine (LightGBM), the five models are trained to introduce the learning curve to judge the model training state and analyze and solve problems during training. The model is finally used for prediction and the prediction results are obtained.

The third point is the analysis of the predicted results. The prediction results of the five models are analyzed and discussed by using the mean square error, the mean absolute error and the prediction bias. The prediction results are compared with the real data, and select the most appropriate prediction model.

The experimental results show that after using various prediction models to predict the passenger flow of bus lines ,the LightGBM model performs best in mean square error, mean absolute error and prediction bias. The prediction results are more accurate than other models. The accuracy is selected by comparing the LightGBM model among the five models as the most appropriate prediction model in this paper.

Key Words: Bus passenger flow forecast; Linear regression; Decision tree; GBDT; XGBoost; LightGBM

目 录

第1章 绪论 1

1.1 研究目的及意义 1

1.1.1 研究目的 1

1.1.2 研究意义 1

1.2 国内外研究现状分析 1

1.3 论文研究内容 3

1.4 论文结构 3

第2章 公交线路客流数据处理 5

2.1 数据描述与预处理 5

2.1.1 数据描述 5

2.1.2 数据预处理 8

2.2 公交客流的时间分布特征 9

2.3 公交客流的影响因素 11

2.3.1 天气状况对客流的影响 11

2.3.2 温度对客流的影响 12

2.3.3 风力对客流量的影响 14

2.4 公交客流特征选取 15

2.5 本章小结 16

第3章 公交线路客流预测 17

3.1 基于线性回归的公交线路预测 17

3.1.1 算法原理 17

3.1.2 模型预测 17

3.2 基于决策树的公交线路预测 23

3.2.1 算法原理 23

3.2.2 模型预测 24

3.3 基于GBDT的公交线路预测 29

3.3.1 算法原理 29

3.3.2 模型预测 30

3.4 基于XGBoost的公交线路预测 33

3.4.1 算法原理 33

3.4.2 模型预测 34

3.5 基于LightGBM的公交线路预测 36

3.5.1 算法原理 36

3.5.2 模型预测 37

3.6 本章小结 40

第4章 预测结果分析 41

4.1 模型预测效果对比 41

4.2 模型比较 43

4.3 本章小结 45

第5章 总结及展望 46

5.1 论文总结 46

5.2 未来工作展望 46

参考文献 47

致谢 48

第1章 绪论

研究目的及意义

研究目的

随着我国经济的飞速发展,城市中的人口和车辆数量也急剧的增加,这一现象直接导致了人们出行量的大量增加,由此引发了大量的交通问题,其中交通拥堵问题最为突出,为了解决这些问题,大力发展城市公共交通就成为了一个非常重要的手段。

公共交通是城市交通中一个不可缺少的版块,其运行的优劣程度会影响到我国经济的运转状况和市民的生活质量。而公交线路的客流量预测是城市公共交通建设的基础和前提,在城市交通项目研究及交通状况评价过程中都需要进行各种交通情况的调查和预测,所以城市公交线路客流量预测会直接影响城市交通规划和建设的科学性和合理性,具有非常重要的现实影响与理论价值。

研究意义

本文以公交线路客流预测为出发点,研究某市部分公交线路的历史公交刷卡数据,预测线路的客流情况,通过预测分析首先为众多相关部门提供了切实有效的数据,对城市的资源及人力进行分配,提高整个城市交通系统的安全性、舒适性和经济效益。其次通过预测分析可以为相关部门在处理各种紧急突发事件中提供科学有效的数据。在一些重大活动或重大节日过程中,客流量的预测可以为相关部门处理应对市民出行方式进行合理的调控与匹配,保证活动的顺利展开和市民的出行方便相适应。依据客流预测分布的结果,可以提早为人们选择适合的出行线路、避开线路的出行客流高峰以及为合理调配公交资源提供信息技术支持。最终实现公交线路客流预测,为出行乘客提供信息对称、安全舒适的外出环境,用数据引领未来城市智慧出行。

国内外研究现状分析

对于公共交通客流预测等方面的研究,国外相对于国内开始的更早,并且使用了很多不同的技术手段和模拟方法,在有关公交的客流预测、数据采集和分配调度等方面都取得了不错的成绩,在国内,随着国家对城市公共交通的重视程度不断提高,探索城市公交客流变化的技术水平也不断的飞跃,通过对技术手段及研究方法的不断改进,一大批有效的客流预测成果不断踊跃,产生了极大的影响。

在针对客流数据处理方面,龙瀛等人采用基于2008年北京市连续一周的公交IC卡刷卡数据,初步提出了从传统的居民出行调查和城市GIS数据建立规则,用公交IC卡(Smart Card Data ,SCD)数据挖掘的方法,具有较好的可靠性[1]。左快乐通过客流规律总结,运用时间序列分析方法将客流数据用于客流预测[2]。刘雪琴证明多元线性回归模型具有较高的预测精度,能够快速准确地预测出线路时段客流[3]

在公交客流预测方面,姜平等人通过分析神经网络的作用机理和公交年客流量的影响因素建立了公交客流预测的径向基神经网络模型(RBF)和BP神经网络模型.结果表明所建模型具有较高的预测精度,效果较好[4]。李振选用了非线性映射能力以及学习能力强的BP人工神经网络模型来进行预测,综合考虑了历史数据、气温以及天气因素的影响。实验表明,预测结果具有较好的精度[5]。陆百川等人使用了基于IC卡数据和RBF神经网络的短时公交客流量预测模型进行预测并介绍了具体预测过程[6]。Liu, Lijuan等人基于深度学习使用SAE-DNN提出一种新的客流预测模型。并使用厦门BRT数据进行有效测试[7]。邹巍等人提出一种基于遗传算法与小波神经网络的轨道交通短时客流预测方法,结果表明,相比遗传算法优化的BP神经网络模型,单一的小波神经网络模型其预测精度更高,误差更小,能在实际中应用[8]。Roos, Jérémy等人提出了一种基于动态贝叶斯网络的方法来预测巴黎城市轨道交通网络的短期客流量,该方法旨在即使在数据不完整的情况下也能执行[9]。YunBai等人提出了一种多模式深度融合方法来预测公交客流量。该方法可以提高客流预测精度[10]。赵梦琪提出一种面向公交刷卡数据处理的非参数随机建模方法(simHash)。simHash能够运用类型更加宽泛的特征映射函数对相似特征数据进行处理,使其建立的预测模型精确度更高[11]

除现有的公交线路客流预测方法之外,在交通预测领域还有更多的新手段、新思路。杨新苗等人提出一种基于模糊神经网络理论的公交线路客流预测模型。实验比较发现 ,该模型具有较强的自适应性 ,其预测结果优于常规时间序列模型AR、ARMA得到的预测结果。该模型适用于公交企业运营调度管理的需要[12]。郭雅楠以经典的BP神经网络模型为基础,提出了两种改进后的组合模型,其一结合了粒子群优化算法的组合模型,其二应用了经验模态分解方法的组合模型。实验结论证实了新方法在预测客流量方面的可用性和有效性[13]。陈奇平则提出根据公交线路客流的不同特性建立不同的预测模型,并不执着于算法本身,而是充分挖掘公交线路客流数据的特征和影响因素,根据不同特征构造不同的数据集来提高预测精度[14]。Wei Guan等人首创了一种融合了神经网络、卡尔曼滤波和ARIMA模型的组合模型,并选取了北京三环的交通流量做预测,结果表明单项模型在交通拥堵时预测效果较好,而组合模型在非拥堵时段预测效果更好[15]

以上是毕业论文大纲或资料介绍,该课题完整毕业论文、开题报告、任务书、程序设计、图纸设计等资料请添加微信获取,微信号:bysjorg。

相关图片展示:

您需要先支付 80元 才能查看全部内容!立即支付

企业微信

Copyright © 2010-2022 毕业论文网 站点地图