白少明**
(中国铁路设计集团有限公司,天津300308)
摘要:铁路客货运量是铁路行业发展的重要指标,反映铁路客货运发展状况和相关企业的经营管理水平,为了科学准确地预测“十四五”时期铁路客货运量,在分析铁路客货运量主要影响因素的基础上,构建基于线性回归理论的铁路客货运量预测模型。以2010-2019年国内生产总值(GDP)和铁路客货运量数据为基础,以国内生产总值为自变量x铁路客货运量为因变量y分别构建线性回归模型,通过相关系数检验和t检验验证变量之间是否存在线性相关关系,通过检验可知铁路客运量与国内生产总值之间存在明显线性相关,而铁路货运量与国内生产总值之间不存在线性关系。因此运用线性回归模型预测“十四五”期间铁路客运量,为全国铁路规划、运输组织优化、客运产品丰富提供理论依据,为交通强国铁路先行提供重要支撑。
关键词:线性回归 运量预测 铁路客货运量
中图分类号:U292.4 文献标识码:A
Research on Railway Passenger and Freight Volume Based on Linear Regression Model
BAI Shaoming
(China Railway Design Corporation,Tianjin 300308,China)
Abstract: Railway passenger and freight volume is an important indicator of the railway development, reflecting the development status and management level of railway passenger and freight transportation. In order to scientifically and accurately predict the railway passenger and freight volume during the "14th Five-Year Plan" period, the main impact of railway passenger and freight volume is analyzed On the basis of factors, a railway passenger volume forecast model based on linear regression theory is constructed. Based on the national GDP and railway passenger and freight volume data from 2010 to 2019, and the national GDP as the independent variable x railway passenger and freight volume as the dependent variable y, a linear regression model was constructed, and the correlation coefficient test and t test were used to verify the existence of the variables Linear correlation. The test shows that there is a strong linear correlation between railway passenger traffic and national GDP, but there is no linear relationship between railway freight traffic and national GDP. Therefore, the linear regression model is used to predict the railway passenger volume during the "14th Five-Year Plan" period, which provides a theoretical basis for national railway planning, transportation organization optimization, and enrichment of passenger transportation products, and provides important support for the railways of powerful transportation countries.
Keywords: linear regression, traffic forecast, railway passenger and freight volume
铁路客货运量趋势可以反映出铁路行业的整体发展状况,以及铁路行业对国民经济社会发展的支撑作用。主要受国内生产总值(GDP)、产业经济政策、居民消费水平等因素综合影响,为了提高铁路客货运量预测的准确度,分析影响铁路客货运量的主要影响因素构建线性回归模型,并进行回归检验变量之间是否存在线性关系,进而对“十四五”期间的客货运量进行预测。
1.铁路客货运量影响因素分析
1.1客运量影响因素
铁路客运量主要受国民经济发展水平、居民收入水平等因素影响,随着高速铁路逐步成网,动车组具有安全舒适、准时便捷、票价适中等诸多优点,已成为越来越多人出行的第一选择,铁路客运量逐年增加呈上升趋势。
1.2货运量影响因素
近年来我国经济结构持续转型升级,经济发展由高速度增长进入高质量发展的新阶段,全社会货物运输需求结构发生了重大变化,大宗货物运输需求下降,随着电子商务的蓬勃发展,“白货”和高附加值货物运输需求快速增加,用户对货物运输的安全性、便捷性和时效性等有了更高的要求。铁路货运量市场占有率呈下降趋势,主要原因有国民经济结构调整、居民消费升级,电力、煤炭、矿石和钢铁等行业产能调整,进出口贸易,以及其他交通运输方式的激烈竞争等因素综合影响。
2.基于线性回归理论的铁路客货运量预测模型
2.1构建模型
将预测对象铁路客货运量作为因变量y,将主要影响因素国内生产总值(GDP)作为自变量x,则变量之间的相互关系采用一元线性回归模型可以表示为:,其中, a为回归常数、b为回归系数、e为残差项。
2010-2019年的铁路客货运量和国内生产总值,均满足以下关系:,在线性回归预测过程中,残差项是无法准确估计的,线性回归预测借助得到预测对象的估计值。通过确定a和b,从而y与x之间的关系可表示为: 、线性回归预测过程中一般采用普通最小乘法原理求出回归系数。由此求得的回归系数为
公式1 公式2,其中、分别是自变量x和因变量y的实际值,、分别表示x和y的平均值。 、 ,其中n为样本量。对于每一个自变量x的实际值,都有拟合值: ,与实际值的差,便是残差项: 。
2.2回归检验
通过计算得出a、b值构建完成预测模型后,需要对自变量x和因变量y之间的线性关系合理与否进行验证。本文采用相关系数R检验、回归系数t检验两种方法判断变量间的线性关系是否合理。
2.2.1相关系数R检验
相关系数R是描述两个自变量x和因变量y之间的线性相关关系强弱的指标,用如下公式表示。
公式3
表1 R值相关性强弱说明
Tab.1 The strength of the R-value correlation
R=-1 |
-1<R<0 |
R=0 |
0<R<1 |
R=1 |
完全负相关 |
负相关 |
不相关 |
正相关 |
完全正相关 |
由上表分析可知,R的绝对值越接近1,表明变量之间相关性越强;R的绝对值越接近0,表明变量之间相关性越弱。依据公式3计算出R的实际值后,通过查找相关系数检验表查得在自由度(n-2)和显著性水平(一般取=0.05)情况下R的临界值,若R的实际值大于等于临界值,则说明自变量x和因变量y之间的线性关系合理:若R的实际值小于临界值,则说明自变量x和因变量y之间的线性关系不合理。
2.2.2 回归系数t检验
通过公式4计算出回归系数,然后与t值进行比较得出自变量x和因变量y之间线性关系是否合理。
公式4
其中,是参数b的标准差,,n为样本数量,为回归标准差,。服从t分布,通过t分布表查得在自由度为n-2时的,如果的绝对值大于t,则表明回归系数t检验通过,说明变量x和y之间线性假设合理;如果的绝对值小于或等于t,则表明回归系数t检验未通过,说明变量x与y之间线性假设不合理。
2.3预测流程
线性回归预测流程见下图所示:
图1 线性回归预测流程图
Fig.1 Flow chart of linear regression prediction
3.客货运量预测模型构建
近年来我国经济社会发展水平不断提高,到2019年国内生产总值(GDP)接近100万亿人民币;铁路建设尤其是高速铁路的建设取得了举世瞩目的成就“四纵四横”已经建成通车,“八纵八横”也初具规模预计“十四五”期间将建设完成,到2019年底全国铁路营业里程达到13.9万公里其中高速铁路3.5万公里。“十四五”期间随着我国经济社会的进一步转型升级、人民生活水平的提升,居民出行和货物运输的需求势必会增加,铁路客货运量呈现持续增长的态势。本文以2010—2019年国内生产总值(GDP)和铁路客货运量数据为基础,通过线性回归理论构建铁路客货运量预测模型,进行回归检验判断铁路客货运量与国内生产总值(GDP)是否存在线性关系,最后对“十四五”期间铁路客货运量数据进行预测。
表2 2010-2019国内生产总值和铁路客货运量
Tab.2 2010-2019 Gross Domestic Product and Railway Passenger and Freight Volume
年度 |
国内生产总值(万亿元) |
客运量(亿人次) |
货运量(亿吨) |
2010 |
41.2119 |
16.2609 |
36.4271 |
2011 |
48.794 |
18.6226 |
39.3263 |
2012 |
53.858 |
18.9337 |
39.0438 |
2013 |
59.2963 |
21.0597 |
39.6697 |
2014 |
64.3563 |
23.5704 |
38.1334 |
2015 |
68.8858 |
25.3484 |
33.5801 |
2016 |
74.6395 |
28.1405 |
33.3186 |
2017 |
83.2036 |
30.8379 |
36.8865 |
2018 |
91.9281 |
33.7495 |
40.9268 |
2019 |
99.0865 |
36.6002 |
43.8904 |
注:数据来源与2010-2019年统计年鉴
3.1模型构建
以国内生产总值为自变量x,以铁路客运量为因变量、货运量为因变量分别构建线性回归模型、。依据公式1和公式2分别计算出;。
3.2回归检验
3.2.1相关系数检验
分别对、进行相关系数检验。
首先对国内生产总值(GDP)与铁路客运量之间的线性关系进行验证,根据公式3=0.99,在时,自由度=n-2=10-2=8,查相关系数表得因为,故在的显著性检验水平上检验通过,说明国内生产总值与铁路客运量存在明显的线性关系。
其次对国内生产总值与铁路货运量之间的线性关系进行验证,根据公式10=0.34,在时,自由度=n-2=10-2=8,查相关系数表得因为,故在的显著性检验水平上检验不通过,说明国内生产总值(GDP)与铁路货运量不存在线性关系。
3.2.2 t检验
分别对、进行t检验。
首先对国内生产总值(GDP)与铁路客运量之间的线性关系进行验证,根据公式4 =31.5,在时,自由度=n-2=10-2=8,查t检验表得,因为,故在的显著性检验水平上t检验通过,说明国内生产总值与铁路客运量存在明显的线性关系。
其次对国内生产总值与铁路货运量之间的线性关系进行验证,根据公式11 =1.03,在时,自由度=n-2=10-2=8,查t检验表得,因为,故在的显著性检验水平上t检验不通过,说明国内生产总值(GDP)与铁路货运量不存在线性关系。
综上所述,可知铁路客运量与国内生产总值(GDP)存在线性关系可以使用线性回归模型预测“十四五”期间的客运量;铁路货运量与国内生产总值(GDP)不存在线性关系不可以使用线性回归模型预测“十四五”期间的货运量。
3.3模型检验
国内生产总值(GDP)与铁路客运量之间存在明显线性关系,依据公式得出2010—2019年的客运量预测值与实际值进行对比分析研究结果详见下表:
表3 铁路客运量预测误差分析
Tab.3 Analysis of prediction error of railway passenger volume
年度 |
实际值 |
预测值 |
残差项 |
相对误差 |
2010 |
16.2609 |
15.3717 |
0.7907 |
4.86% |
2011 |
18.6226 |
18.1311 |
0.2416 |
1.30% |
2012 |
18.9337 |
19.9741 |
1.0824 |
5.72% |
2013 |
21.0597 |
21.9533 |
0.7986 |
3.79% |
2014 |
23.5704 |
23.7949 |
0.0504 |
0.21% |
2015 |
25.3484 |
25.4433 |
0.0090 |
0.04% |
2016 |
28.1405 |
27.5373 |
0.3638 |
1.29% |
2017 |
30.8379 |
30.6542 |
0.0338 |
0.11% |
2018 |
33.7495 |
33.8294 |
0.0064 |
0.02% |
2019 |
36.6002 |
36.4346 |
0.0274 |
0.07% |
由上表分析可知,十年间平均相对误差仅为1.74%、准确程度高达98.26%,因此采用线性回归模型预测铁路客运量是可靠准确的。
4客货运量预测结果分析
4.1.1客运量预测结果
由前文可知,铁路客运量与国内生产总值(GDP)之间存在明显的线性关系具体如以下公式所示:。目前我国经济发展由高速增长进入为高质量发展的新常态,预计“十四五”期间经济结构继续转型升级,发展质量进一步提高结构进一步优化,根据世界银行、国际货币基金组织以及国家发展改革委员会等权威机构预测中国“十四五”期间国内生产总值年均增长6.0%左右,根据上述公式可计算出“十四五”期间铁路客运量详见下表:
表4“十四五”期间铁路客运预测量
Tab.4 Railway passenger traffic forecast during the 14th Five-Year Plan period
年度 |
2021 |
2022 |
2023 |
2024 |
2025 |
客运量(亿人次/年) |
39.3628 |
41.7022 |
44.1819 |
46.8105 |
49.5967 |
由上表可知,2021—2025年客运量呈增长的趋势,到2025年全国铁路客运量接近50亿人次,并且增量范围在5%-7%之间,符合铁路客运量的增长情况,预测的结果是较为准确可靠的。
4.1.2货运量预测分析
目前我国铁路货运量主要由大宗货物煤炭、矿石和钢材等构成,白货以及高附加值的轻快货物占比较小,而随着经济结构持续转型升级,煤炭、钢铁等行业产能调整,进出口贸易政策变化等因素的影响,全社会大宗货物需求量呈下降趋势,而白货以及高附加值的轻快货物需求量快速增加。而既有铁路货物运输组织、运输装备、企业管理等诸多方面均不适应目前的运输需求,导致铁路货运量出现波动。
结论
根据预测结果“十四五”期间铁路客运量将持续增长符合我国经济发展形势,要求铁路行业在“十四五期”间继续保持适度的建设投资规模,其中高速铁路建设需加快进度以满足日益增长的客运需求,通过优化运输组织、旅客列车开行方案、科学合理制定列车运行图实行“一日一图”、采取浮动票价等措施,最大限度满足吸引客流提高铁路客运量。进一步调整铁路货运组织方式、面向市场提高企业管理水平和竞争力、提高服务意识,可利用高速动车组运送高附加值货物提高铁路的综合竞争力。
参考文献:
[1] 侯维磊,刘力军,崔晶娜.基于GRA—PCA—GA—BP网络模型的铁路货运量预测分析[J].铁道货运,2017,35(1):54-58.
HOU Wei-lei,LIU Li-jun,CUI Jing—na.Forecast Analysis of Railway Freight Transport Volume based on GRA··PCA--GA-BP Network Model[J].Railway Freight Transport,2017,35(1):54-58.
[2] 杨军,侯忠生.基于小波分析的最小二乘支持向量机轨道交通客流预测方法[J].中国铁道科学,2013,34(3):122—127.
YANG Jun,HOU Zhongsheng.A Wavelet Analysis Based LS-SVM Rail Transit Passenger Flow Prediction Method [J].China Railway Science,2013,34(3):122—127
[3] DRAGoMIRETSKlY K,ZOSSO D.Variational Mode Decomposition[J].IEEE Transactions on Signal Processing,2014,62(3):531-544.
[4]冯妍,李得伟.基于Logit模型的城际运输通道客运量分担率计算研究[J].铁道运输与经济,2016,38(4):47—51.
FENG Yan,LI Dewei.Research on Passenger Traffic Volume Sharing Rate of Inter·city Transport Corridor based Logit Mode Corridorbased on Mode[J].Railway Transport and Economy,2016,38(4):47 -51.
[5]郝军章,崔玉杰,韩江雪.基于sARIMA模型在我国铁路客运量中的预测[J].数学的实践与认识,2015,45(18):95-96.
HA0 Jun-zhang,CUI Yu-jie,HAN Jiang-xue.Prediction of the Railway Passenger VOlume based on the SARIMA Model[J].Mathematics in Practice and Theory,20155,45(18):95-96.
[6]杨祺煊.基于主成分分析与GA BP网络的铁路客运量预测研究[J].军事交通学院学报,2017,19(2):84~89.
YANG Qi—xuan.Prediction of Railway Passenger Volume based on PCA and GA—BP Network[J].Joumal of Military Transportatjon University,2017,19(2):84—89.
[7]周鹏飞. 高速铁路跨线客流输送模式研究[D]. 北京:北京交通大学, 2015.
ZHOU Pengfei. Research on the cross-line passenger flows transportation modes on high-speed railways[D].Beijing: Beijing Jiaotong University, 2015.
[8]张晓宇. 高速铁路列车开行方案关键要素对客运需求的影响研究[D]. 北京: 北京交通大学, 2016.
ZHANG Xiaoyu. Influence research of the key factors of operation plan on passenger demand at the high-speed railway[D]. Beijing: Beijing Jiaotong University, 2016.