关键词:ARIMA 模型;平稳时间序列;能源消费量;预测
1005-5312(2013)20-0280-01
一、ARIMA模型的构建步骤
通过时间序列的散点图或折线图可对序列进行平稳性初步判断。如果时间序列存在一定变化趋势,则需要对序列进行差分处理使之转化成为平稳时间序列,此时差分的次数便是ARIMA(p,d,q)模型的阶数d。根据平稳时间序列的自相关图和偏自相关图可初步确定ARIMA模型数p与q。如果平稳时间序列的自相关值或偏自相关值在±2倍估计标准差以内,则其在显著水平为5%的情形与零无显著差异。若序列的滞后k期偏自相关函数在k>m时等于零,则可近似判断是m阶截尾;若序列的滞后k期自相关函数在k>n时,则可近似判断是n阶截尾。此时,通过偏自相关图中与m相邻几期的偏自相关函数可初步确定p的可能取值;同理,利用自相关图中与n相邻几期的自相关函数初步确定q的可能取值。然后借助AIC准则确定p与q的取值。
二、我国能源消费量ARIMA建模
(一)时间序列的平稳化处理
序列{Xt}存在显著增长趋势,且随时间推移不断扩大,这表明该序列存在异方差,序列{Xt}的ADF检验统计量(1.108141)大于1%,5%与10%显著性水平的临界值,表明该序列是非平稳的,PP检验也验证了该结论(PP 检验统计量大于其1%,5% 与10%显著性水平的临界值)。这说明我国能源消费量受多种因素影响不宜采用结性因果模型预测。由于序列{Xt}存在异方差,对其进行对数转换,令Yt=log(Xt),但序列的{Yt}的ADF和PP检验(含常数项和趋势项)结果显示,该序列仍是非平稳的。接着对{Yt}进行一阶差分处理,令Zt=Yt-Yt-1,对序列{Zt}进行平稳性检验(无常数项和趋势项),检验结果显示,该序列的ADF检验统计量和PP检验统计量分别为-3.533102和-3.533102,在99%的置信水平下通过ADF检验和PP检验,因而序列{Zt}为平稳时间序列。(二)ARIMA模型阶数p与q的确定
为确定ARIMA(p,d,q)模型阶数p与q,计算{Zt}序列1-12期的相关关系。可知序列1、2阶偏自相关系数超出倍估计标准差,在显著水平为5%的情形下显著不为零,2阶以后偏自相关系数在倍估计标准差以内,即偏自相关函数2阶以后截尾;同理,序列1、2阶自相关系数超出倍估计标准差,在显著水平为5%的情形下显著不为零,2阶以后偏自相关系数在倍估计标准差以内,即自相关函数2阶以后截尾,结合自相关图和偏自相关图可初步确定p=2或p=3,q=2或q=3。计算不同p与q组合所对应的AIC值。当p=3,q=2时对应的AIC值最小,故最终确定:p=3,q=2。由此,ARIMA(p,d,q)模型可确定为ARIMA(3,1,2)。(三)ARIMA模型参数估计与诊断检验
为了选择统计性质优良的模型,在同等或相似条件下,尤其是当滞后分布的长度确定时,通常选择信息准则统计量(AIC)较小的模型。由模型的AIC(-4.524056)、R2(0.658048)与■2(0.572560),可初步确定ARIMA(3,1,2)为平稳序列{Xt}较为理想的预测模型。通过对模型的残差序列进行单位根检验,发现ADF检验统计量为-10.39883,明显小于1%、5% 与10%显著性水平的临界值,这表明模型残差序列为白噪声序列。由此可确定ARIMA(3,1,2)为平稳序列{Zt}较为理想的预测模型。
(四)模型预测
经过上面的分析,得到原时间序列的预测公式为:Xt=exp(Yt-1+0.063174-0.389147Zt-1+0.017655Zt-2+0.091549
Zt-3+
1.724498εt-1+0.978011εt-2)
根据的预测公式对2009~2011年我国能源消费量进行事后预测可以看出,预测值与实际值差异不大,预测相对误差较小,说明ARIMA模型对我国能源消费量预测效果较好。因此,模型ARIMA(3,1,2)对可我国能源消费量进行预测。三、结论
我国能源消费量序列为非平稳时间序列,是一组依赖于时间变化的随机变量,可用ARIMA模型予以近似描述。本文运用1975~2011年我国能源消费数据建立了ARIMA(3,1,2)模型,经模型参数估计与诊断检验,以及实证检验发现预测相对误差较小,预测精度较高,可用于短期内我国能源消费量预测,为政策的制定提供一定的依据。作为世界最大的能源消费国,目前中国能源消费量增长占全球能源消费增长七成以上,未来几年,随着中国电煤消费量的增加,以及国际石油不断攀升所导致的煤炭液化产品消费的增长,中国能源消费量将保持持续增长趋势。科学的能源消费预测结果可为国家合理规划能源生产和进出口提供重要依据。
源于:期刊论文www.shuoshilunwen.com