周一至周五 | 9:00—22:00

基于密度算子的组合预测方法

作者: 易平涛 郭亚军 李伟伟

  摘 要:考虑到单项预测方法在不同时刻预测准确性的差异,提出了一种基于密度算子的组合预测方法。该方法的核心思想是利用样本区间内单项预测方法的预测准确性对预测值聚类;然后基于密度算子的思想对单项预测法集结,得到一种新的组合预测模型;在此基础上,基于预测值和相应观察值误差最小的思想确定单项预测法的加权系数。该模型充分利用了样本区间内单项预测法的预测准确性,因而预测值具有较高的准确性。最后,给出一个实例,并对其结果进行比较分析,证明了该组合预测模型的有效性。
  关键词:组合预测;密度算子;预测准确度;密度加权向量
  中图分类号:C934 文献标识码:A 文章编号:1003-5192(2011)04-0060-05
  
  Combination Forecasting Method Based on Density Operator
  YI Ping-tao, GUO Ya-jun, LI Wei-wei
  (School of Business Administration, Northeastern University, Shenyang 110004, China)
  Abstract:Considering the difference of single forecasting method’s veracity at different times, this paper presents a new combination forecasting model based on density operator. The core ideal of this method is to cluster the forecasting values by the forecasting veracity, then build the combination forecasting model using the density operator. Based on this, the single forecasting method weight is determined through the minimal warp between the forecasting values and the real values. This combination forecasting model makes full use of single forecasting model’s veracity, so the forecasting value veracity has been increased. At last, an application example is given, and its result is analyzed to illustrate the validity of the new combination forecasting model.
  Key words:combination forecasting; density operator; forecasting veracity; the density weighting vector
  
  1 引言
  
  小到人们日常生活,大到国家发展规划,都会遇到预测问题,比如农场品市场行情预测、股市预测乃至国民经济发展趋势预测等。预测对象往往是相互联系,相互制约的复杂系统,而使用单个预测模型只能从某个角度提供相应的有效信息,信息源不够广泛,因而预测的准确性难以保证。Bates和Granger[1]己于1969年首次提出组合预测的概念,即综合考虑各单项预测方法所提供的信息,将不同的单项预测方法集结得到组合预测模型。由于它能有效地提高预测精度,因而引起了国内外广大学者的研究兴趣[1~10]。
  本文在分析现有组合预测模型的基础上,考虑到样本区间内单项预测方法在不同时刻预测准确性的差异,基于密度算子的思想提出了一种新的组合预测模型。该模型首先利用单项预测方法预测准确性的差异对其进行聚类;然后基于密度算子[11]的思想对单项预测值进行集结,得到组合预测值;在此基础上,以组合预测值和实际观察值的误差最小为基准确定单项预测法在组合预测模型中的加权系数。该预测模型充分利用了单项预测法的预测准确性,从而进一步提高了组合预测值的准确性。
  
  2 传统的加权算术平均组合预测方法
  
  设某社会经济现象的指标序列的观察值为{xt;t=1,2,…,n},有m种可行的单项预测方法对其进行预测,xit(i=1,2,…,m;t=1,2,…,n)为第i种预测方法在t时刻的预测值(或称拟合值)。为方便起见,记N={1,2,…,n},M={1,2,…,m}。
  设w=(w1,w2,…,wm)T为m种单项预测方法在组合预测中的加权系数,应该满足归一性和非负性,即∑mi=1wi=1,wi≥0,i∈M。
  显然,J为各种预测方法的加权系数向量w=(w1,w2,…,wm)T的函数,所以J也可记为J(w)。
  对于组合预测方法,J(w)的大小表明了组合预测值和实际值之间的接近程度。J(w)越小,表示加权算术平均的组合预测值越接近于实际值。因此以误差平方和最小为准则的加权算术平均组合预测模型可表示为
  模型(M1)的最优解即为加权算术平均组合预测模型中单项预测方法的加权系数。
  
  3 密度算子简介
  
  文献[11]首次提出了密度算子的概念,并将其应用于多属性决策中,取得了较好的效果。密度算子是基于属性信息或群体评价信息分布的疏密程度提出的一种信息集结方法,其作为信息集结的中间过程,在实际应用中需要与已有的信息集结算子(AA,WAA,OWA,Min,Max)合成使用。
  密度算子的具体应用过程可以简述为以下步骤。
  步骤1 评价信息的聚类。将已有的属性信息或群体评价信息根据信息分布的疏密程度进行聚类,可采用的聚类方法有有序增量分割法[11]、类平均法[12]等。
  步骤2 密度加权向量的确定。评价者根据其对“组间同性”的偏好程度(即评价者偏好主体信息或群体共识,抑或是偏好极端信息或个别意见),采用一定的表达式来确定密度加权向量,可采用的方法主要有比例加速法[11]、规模增益法[12]、熵值规划法[12]等。
  步骤3 各组评价信息的内部集结。按照步骤1对评价信息进行分组后,需要对各组内部的评价信息进行集结,可采用已有的信息集结算法,如AA、WAA、OWA、Min、Max等算子。
  步骤4 各组评价信息之间的集结。按照步骤3计算出各组的评价信息之后,结合步骤2求得的密度加权向量,可采用“线性”或“积性”[13]密度算子对各组之间的评价信息进行集结。
  
  4 基于密度算子的组合预测模型
  
  4.1 单项预测方法的聚类
  组合预测的目的是为了提高预测的准确性,下面给出一种基于预测准确性的单项预测值聚类方法。
  定义4 称
  dit=|xit-xt|, i∈M,t∈N(4)
  为t(t∈N)时刻第i(i∈M)种预测方法的预测值与相应实际值的偏离度。其中dit>0且dit越大,说明第i(i∈N)种预测方法的预测值与相应实际值的偏差越大,其预测的准确性越低。
  定义5 称
  μ(t)i=e(1-dit)/∑mi=1e(1-dit), i∈M,t∈N(5)
  为t(t∈N)时刻第i(i∈M)种预测方法的预测准确度,满足μ(t)i∈(0,1)且∑mi=1μ(t)i=1。
  设t(t∈N)时刻所有单项预测法的准确度为μ(t)1,μ(t)2,…,μ(t)m。下面给出基于预测准确度对单项预测值进行聚类的方法――“有序增量分割法”:
  (1)按照单项预测法的预测准确度由大到小的顺序对μ(t)1,μ(t)2,…,μ(t)m重新排序,记为μ′(t)1,μ′(t)2,…,μ′(t)m。
  (2)对重新排序后的单项预测准确度,计算相邻两个单项预测准确度的离差,即d(t)i=μ′(t)i-μ′(t)i+1,i=1,2,…,m-1。
  (3)设将t(t∈N)时刻的m种单项预测准确度分为l组(l≤m),则在前l-1个最大的d(t)i(i=1,2,…,m-1)处分割,即可得到l个数组。
  (4)将l个数组中的单项预测准确度换成其对应的单项预测值,即可得到t(t∈N)时刻m种单项预测值的l组聚类。
  设t(t∈N)时刻m种单项预测值的集合为X^t
  ={x1t,x2t,…,xmt},其l组聚类为X^1t,X^2t,…,X^lt,每组中的元素个数为kj,j=1,2,…,l。为方便起见,记L={1,2,…,l}。
  通过以上分析可知:当01时,Tp(ξ(t))>0.5,表明预测者比较偏好预测准确性偏高的数组。
  为了提高组合预测的准确性,理性的预测者一般会比较偏好预测准确性偏高的数组,即令q>1。下面给出确定密度加权向量的两种方法:
  方法1 给定q一任意值,按照(8)式计算组间预测准确性的偏好度Tp(ξ(t)),若Tp(ξ(t))的值满足预测者的偏好,则将该q值代入(7)式求得密度加权向量;否则,对q重新赋值,重复上述过程,直到满足预测者的偏好为止。
  方法2 预测者事先给出其组间预测准确性的偏好度,设为λ,将其代入(8)式求得q的取值,然后将q值代入(7)式求得密度加权向量。
  4.3 基于密度算子的组合预测模型
  设m种单项预测方法在组合预测中的加权系数ω=(ω1,ω2,…,ωm)T,满足ωi∈(0,1)且∑x(j)kjt}(j∈L)中的元素重要性的归一化加权向量,满足ω(j)i∈(0,1)且∑kji=1ω(j)i=1。
  定义9 设et为第t时刻的基于密度算子的组合预测值与相应的实际值之间误差,则et的表达式为
  与传统的加权算术平均组合预测方法原理相同,基于密度算子的组合预测方法中,J(ω)的大小也表明了组合预测值和实际值之间的接近程度。J(ω)越小,表示基于密度算子的组合预测值越接近于实际值。因此以误差平方和最小为准则的基于密度算子的组合预测模型可表示为
  模型(M2)的最优解即为基于密度算子的组合预测模型中单项预测方法的加权系数。
  
  5 实例分析
  
  为了证明基于密度算子的组合预测方法的有效性,本文对基于密度算子的组合预测模型的结果与传统的加权算术平均组合预测模型以及单项预测方法的结果进行比较分析。按照预测效果评价原则,选择下列指标作为预测效果评价指标体系:
  选用文献[14]的实例对基于密度算子的组合预测方法的应用进行说明。为更好地分析,本文在文献[14]的基础上,又增加3种单项预测方法。预测对象在10个预测期内的指标实际值分别为:14.9,18.6,22.2,17.6,19.6,24,31.6,43.7,37,47.2;与此对应的单项预测方法1的预测值为10,14.9,23.3,26.1,17.5,20.2,26.4,36.8,52.5,38.5;单项预测方法2的预测值为12,15.48,18.95,22.43,25.9,29.38,32.85,36.33,39.8,43.28;单项预测方法3的预测值为13,16,20.5,19.8,18.7,25.5,30.87,35.98,34.71,40.67;单项预测方法4的预测值为14.3,17.34,19.98,18.34,20.89,23.56,28.68,42.5,41.8,39.86;单项预测方法5的预测值为11.98,16.45,21.67,18.64,21.3,22.56,29.79,39.83,36.98,42.8。
  以单项预测方法1为例,根据(5)式求得其在10个预测期内的预测准确度分别为:0.085,0.046,0.266,0.001,0.124,0.020,0.006,0.003,0.001,0.005。
  按照“有序增量分割法”对单一预测时刻各单项预测值进行聚类,以预测时刻1为例,设分为3组,聚类结果为
  X^(1)1={x41};X^(1)2={x31};
  X^(1)3={x11,x21,x51};采用方法2确定密度加权向量,设预测者对组间预测准确性的偏好度为Tp(ξ(t))=0.7,则q=7.945,对应的密度加权向量为ξ(1)=(0.585,0.229,0.186)T。
  依据规划模型(M1)和(M2)求得传统的加权算术平均组合预测模型和基于密度算子的组合预测模型中单项预测方法的加权系数向量分别为:(0,0,0,0.11,0.89)T和(0.01,0.01,0.69,0.13,0.16)T。
  对于预测效果评价指标SSE,基于密度算子的组合预测模型和传统的加权算术平均组合预测模型以及各单项预测模型的预测效果分别为35.28,56.44,520.6,199.76,129.18,96.16,57.09;对于预测效果评价指标MSE,对应的预测效果分别为0.593,0.751,2.282,1.413,1.137,0.981,0.756;对于预测效果评价指标MAE,对应的预测效果分别为1.285,2.018,6.040,4.112,2.807,2.281,1.988;对于预测效果评价指标MAPE,对应的预测效果分别为0.050,0.078,0.225,0.170,0.098,0.074,0.078;对于预测效果评价指标MSPE,对应的预测效果分别为0.019,0.028,0.083,0.060,0.034,0.027,0.029。
  分析以上数据可知,对于所有的预测效果指标体系,基于密度算子的组合预测方法的预测效果都要优于其他预测方法,从而证明了本文提出的基于密度算子的组合预测方法的有效性和准确性。
  
  6 结束语
  
  本文基于单项预测法的预测准确性提出了基于密度算子的组合预测方法。该方法充分利用了密度算子的优良特性,又与传统的密度算子有所区别:(1)传统密度算子中数据聚类依据的是数据分布的疏密程度,而在组合预测模型中,密度算子数据聚类依据的是单项预测方法的预测准确性分布的疏密程度;(2)传统密度算子中聚类数组的序化依据的是数据组的规模信息,而在组合预测模型中,密度算子聚类数组的序化依据的是数据组预测准确性信息;(3)传统密度算子中密度加权向量的确定依据数据组的“规模信息”或“规模信息”与“功能信息”的结合,而在组合预测模型中,密度算子密度加权向量的确定依据数据组的预测“准确性信息”。可见,基于密度算子的组合预测模型,在充分利用单项预测方法的预测准确度信息的基础上,结合密度加权向量,增强了预测准确度较高的单项预测方法在组合预测模型中的作用,因而进一步提高了组合预测结果的准确性。
  
  参 考 文 献:
  [1]Bates J M, Granger C W J. Combination of forecasts[J]. Operations Research Quarterly, 1969, 20(4): 451-468.
  [2]Bunn D W. Combining forecasts[J]. European Journal of Operation Research, 1988, 33(3): 223-229.
  [3]Donaldson R G, Kamstra M. Forecast combining with neural networks[J]. Journal of Forecasting, 1996, 15(1): 49-61.
  [4]Granger C W J. Combining forecasts-twenty years later[J]. Journal of Forecasting, 1989, 8(3): 167-173.
  [5]唐小我.预测理论及其应用[M].成都:电子科技大学出版社,1992.
  [6]唐小我,曹长修.组合预测最优加权系数向量的进一步研究[J].预测,1994,13(2):48-49.
  [7]陈华友.基于预测有效度的组合预测模型研究[J].预测,2001,20(3):72-73.
  [8]陈华友,刘春林.基于IOWA算子的组合预测方法[J].预测,2003,22(6):61-65.
  [9]周传世,罗国民.加权算术平均组合预测模型及其应用[J].数理统计与管理,1995,(2):17-19.
  [10]陈华友.组合预测方法有效性理论及其应用[M].北京:科学出版社,2008.
  [11]易平涛,郭亚军,张丹宁.密度加权平均中间算子及其在多属性决策中的应用[J].控制与决策,2007,22(5):515-524.
  [12]易平涛,郭亚军.广义实型密度加权平均中间算子及其应用[J].系统工程学报,2010,25(2):190-195.
  [13]易平涛,高立群,郭亚军.基于多源密度信息集结算子的组合评价方法[J].系统工程与电子技术,2009,31(12):2882-2887.
  [14]王应明,罗英. 广义加权算术平均组合预测技术研究[J].预测,1998,17(1):51-53.
  注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文


常见问题解答