A. 马尔科夫 初始概率和绝对概率怎么计算
此处根据的是随机过程马尔可夫链中的极限分布定理。
设此处的平衡概率向量为x=(x1,x2,x3),并且记已知的转移概率矩阵为:
p=00.80.2
00.60.4
1.000
则根据马尔可夫链的极限分布定理,应有xp=x,即:
(x1,x2,x3)*(00.80.2
00.60.4
1.000)
=(x1,x2,x3)
利用矩阵乘法,上式等价于3个等式:
x3=x1
0.8x1+0.6x2=x2
0.2x1+0.4x2=x3
由以上三个等式只能解得:x3=x1,以及x2=2x1
另外,再加上平衡概率向量x的归一性,即:x1+x2+x3=1
最终可解得:x1=0.25,x2=0.5,x3=0.25
不懂再问,祝好!
B. 您好,我想问问您的一个回答的论文题目,百度知道上的问题是:(以下补充)谢谢!
摘 要 研究了沪深300指数日收益率时间序列,经检验其具有马氏性,并建立了马尔可夫链模型。取交易日分时数据,根据分时数据确定状态初始概率分布,通过一步转移概率矩阵对下一交易日的日收益率进行了预测。对该模型分析和计算,得出其为有限状态的不可约、非周期马尔可夫链,求解其平稳分布,从而得到沪深300指数日收益率概率分布。并预测了沪深300指数上涨或下跌的概率,可为投资管理提供参考。
关键词 马尔可夫链模型 沪深300指数 日收益率概率分布 平稳分布
1 引言
沪深300指数于2005年4月正式发布,其成份股为市场中市场代表性好,流动性高,交易活跃的主流投资股票,能够反映市场主流投资的收益情况。众多证券投资基金以沪深300指数为业绩基准,因此对沪深300指数收益情况研究显得尤为重要,可为投资管理提供参考。
取沪深300指数交易日收盘价计算日收益率,可按区间将日收益率分为不同的状态,则日收益率时间序列可视为状态的变化序列,从而可以尝试采用马尔可夫链模型进行处理。马尔可夫链模型在证券市场的应用已取得了不少成果。参考文献[1]、[2]、[3]和[4]的研究比较类似,均以上证综合指数的日收盘价为对象,按涨、平和跌划分状态,取得了一定的成果。但只取了40~45个交易日的数据进行分析,历史数据过少且状态划分较为粗糙。参考文献[5]和[6]以上证综合指数周价格为对象,考察指数在的所定义区间(状态)的概率,然其状态偏少(分别只有6个和5个状态),区间跨度较大,所得结果实际参考价值有限。参考文献[7]对单只股票按股票价格划分状态,也取得了一定成果。
然而收益率是证券市场研究得更多的对象。本文以沪深300指数日收益率为对考察对象进行深入研究,采用matlab7.1作为计算工具,对较多状态和历史数据进行了处理,得出了沪深300指数日收益率概率分布,并对日收益率的变化进行了预测。
2 马尔可夫链模型方法
2.1 马尔可夫链的定义
设有随机过程{Xt,t∈T},T是离散的时间集合,即T={0,1,2,L},其相应Xt可能取值的全体组成状态空间是离散的状态集I={i0,i1,i2,L},若对于任意的整数t∈T和任意的i0,i1,L,it+1∈I,条件概率则称{Xt,t∈T}为马尔可夫链,简称马氏链。马尔可夫链的马氏性的数学表达式如下:
P{Xn+1=in+1|X0=i0,X1=i1,L,Xn=in}=P{Xn+1=in+1|Xn=in} (1)
2.2 系统状态概率矩阵估计
马尔可夫链模型方法的基本内容之一是系统状态的转移概率矩阵估算。估算系统状态的概率转移矩阵一般有主观概率法和统计估算法两种方法。主观概率法一般是在缺乏历史统计资料或资料不全的情况下使用。本文采用统计估算法,其主要过程如下:假定系统有m种状态S1,S2,L,Sm根据系统的状态转移的历史记录,可得到表1的统计表格。其中nij表示在考察的历史数据范围内系统由状态i一步转移到状态j的次数,以■ij表示系统由状态i一步转移到状态的转移概率估计量,则由表1的历史统计数据得到■ij的估计值和状态的转移概率矩阵P如下:
■ij=nij■nik,P=p11 K p1mM O Mpm1 L pmn(2)
2.3 马氏性检验
随机过程{Xt,t∈T}是否为马尔可夫链关键是检验其马氏性,可采用χ2统计量来检验。其步骤如下:(nij)m×m的第j列之和除以各行各列的总和所得到的值记为■.j,即:
■.j=■nij■■nik,且■ij=nij■nik(3)
当m较大时,统计量服从自由度为(m-1)2的χ2分布。选定置信度α,查表得χ2α((m-1)2),如果■2>χ2α((m-1)2),则可认为{Xt,t∈T}符合马氏性,否则认为不是马尔可夫链。
■2=2■■nijlog■ij■.j(4)
2.4 马尔可夫链性质
定义了状态空间和状态的转移概率矩阵P,也就构建了马尔可夫链模型。记Pt(0)为初始概率向量,PT(n)为马尔可夫链时刻的绝对概率向量,P(n)为马尔可夫链的n步转移概率矩阵,则有如下定理:
P(n)=PnPT(n)=PT(0)P(n)(5)
可对马尔可夫链的状态进行分类和状态空间分解,从而考察该马尔可夫链模型的不可约闭集、周期性和遍历性。马尔可夫链的平稳分布有定理不可约、非周期马尔可夫链是正常返的充要条件是存在平稳分布;有限状态的不可约、非周期马尔可夫链必定存在平稳过程。
3 马尔可夫链模型方法应用
3.1 观测值的描述和状态划分
取沪深300指数从2005年1月4日~2007年4月20日共555个交易日收盘价计算日收益率(未考虑分红),将日收益率乘以100并记为Ri,仍称为日收益率。计算公式为:
Ri=(Pi-Pi-1)×100/Pi-1(6)
其中,Pi为日收盘价。
沪深300指数运行比较平稳,在考察的历史数据范围内日收益率有98.38%在[-4.5,4.5]。可将此范围按0.5的间距分为18个区间,将小于-4.5和大于4.5各记1区间,共得到20个区间。根据日收益率所在区间划分为各个状态空间,即可得20个状态(见表2)。
3.2 马氏性检验
采用χ2统计量检验随机过程{Xt,t∈T}是否具有马氏性。用前述统计估算法得到频率矩阵(nij)20×20。
由(3)式和(4)式可得:■.j=■nij■■nik,且■ij=nij■nik,■2=2■■nijlog■ij■.j=446.96,令自由度为k=(m-1)2即k=361,取置信度α=0.01。由于k>45,χ2α(k)不能直接查表获得,当k充分大时,有:
χ2α(k)≈■(zα+■)2(7)
其中,zα是标准正态分布的上α分位点。查表得z0.01=2.325,故可由(1)、(7)式得,即统计量,随机过程{Xt,t∈T}符合马氏性,所得模型是马尔可夫链模型。
3.3 计算转移概率矩阵及状态一步转移
由频率矩阵(nij)20×20和(1)、(2)式得转移概率矩阵为P=(Pij)20×20。考察2007年4月20日分时交易数据(9:30~15:30共241个数据),按前述状态划分方法将分时交易数据收益率归于各状态,并记Ci为属于状态i的个数,初始概率向量PT(0)=(p1,p2,L,pt,L,p20),则:
pj=Cj/241,j=1,2,K,20(8)
下一交易日日收益率分布概率PT(0)={p1(1),p2(1),L,pi(1),L,p20(1)},且有PT(1)-PT(0)p,计算结果如表3所示。
3.4 马尔可夫链遍历性和平稳分布
可以分析该马尔可夫链的不可约集和周期性,从而进一步考察其平稳分布,然而其分析和求解非常复杂。本文使用matlab7.1采用如下算法进行求解:将一步转移概率矩阵P做乘幂运算,当时Pn+1=Pn停止,若n>5 000亦停止运算,返回Pn和n。计算发现当n=48时达到稳定,即有P(∞)=P(48)=P48。考察矩阵P(48)易知:各行数据都相等,不存在数值为0的行和列,且任意一行的行和为1。故该马尔可夫链{Xt,t∈T}只有一个不可约集,具有遍历性,且存在平稳分布{πj,j∈I},平稳分布为P(48)任意一行。从以上计算和分析亦可知该马尔可夫链是不可约、非周期的马尔可夫链,存在平稳分布。计算所得平稳分布如表4所示。
3.5 计算结果分析
表3、表4给出了由当日收益率统计出的初始概率向量PT(0),状态一步预测所得绝对概率向量PT(1)和日收益率平稳分布,由表3和表4综合可得图1。可以看出,虽然当日(2007年4月20日)收益率在区间(1.5,4.5)波动且在(2.5,4.5)内的概率达到了0.7261,表明在2007年4月20日,日收益率较高(实际收盘时,日收益率为4.41),但其下一交易日和从长远来看其日收益率概率分布依然可能在每个区间。这是显然的,因为日收益率是随机波动的。
对下一交易日收益率预测(PT(1)),发现在下一交易日收益率小于0的概率为0.4729,大于0的概率为0.5271,即下一交易日收益率大于0的概率相对较高,其中在区间(-2,-1.5)、(0.5,1)和(1,1.5)概率0.2675、0.161和0.1091依次排前三位,也说明下一交易日收益率在(-2,-1.5)的概率会比较高,有一定的风险。
从日收益率长远情况(平稳分布)来看,其分布类似正态分布但有正的偏度,说明其极具投资潜力。日收益率小于0的概率为0.4107,大于0的概率为0.5893,即日收益率大于0的概率相当的高于其小于0的概率。
4 结语
采用马尔可夫链模型方法可以依据某一交易日收益率情况向对下一交易日进行预测,也可得到从长远来看其日收益率的概率分布,定量描述了日收益率。通过对沪深300指数日收益率分析和计算,求得沪深300指数日收益率的概率分布,发现沪深300指数日收益率大于0的概率相对较大(从长远看,达到了0.5893,若考虑分红此概率还会变大),长期看来沪深300指数表现乐观。若以沪深300指数构建指数基金再加以调整,可望获得较好的回报。
笔者亦采用范围(-5,5)、状态区间间距为1和范围(-6,6)、状态区间间距为2进行运算,其所得结果类似。当采用更大的范围(如-10,10等)和不同的区间大小进行运算,计算发现若状态划分过多,所得模型不易通过马氏性检验,如何更合理的划分状态使得到的结果更精确是下一步的研究之一。在后续的工作中,采用ANN考察所得的日收益率预测和实际日收益率的关系也是重要的研究内容。马尔可夫链模型方法也可对上证指数和深证成指数进行类似分析。
参考文献
1 关丽娟,赵鸣.沪综指走势的马尔可夫链模型预测[J].山东行政学院,山东省经济管理干部学院学报,2005(4)
2 陈奕余.基于马尔可夫链模型的我国股票指数研究[J].商场现代化(学术研讨),2005(2)
3 肖泽磊,卢悉早.基于马尔可夫链系统的上证指数探讨[J].科技创业月刊,2005(9)
4 边廷亮,张洁.运用马尔可夫链模型预测沪综合指数[J].统计与决策,2004(6)
5 侯永建,周浩.证券市场的随机过程方法预测[J].商业研究,2003(2)
6 王新蕾.股指马氏性的检验和预测[J].统计与决策,2005(8)
7 张宇山,廖芹.马尔可夫链在股市分析中的若干应用[J].华南理工大学学报(自然科学版),2003(7)
8 冯文权.经济预测与决策技术[M].武汉:武汉大学出版社,2002
9 刘次华.随机过程[M].武汉:华中科技大学出版社,2001
10 盛千聚.概率论与数理统计[M].北京:高等教育出版社.1989转
C. 马尔可夫链运用在股票指数模型中的局限性
挟制于技术指标
D. 为什么说正态分布在经济领域应用广泛
正态分布在经济领域的广泛应用:
1.财务会计研究领域
随着金融市场和现代企业制度的建立,财务会计向企业外部提供的财务信息倍受各利益关系人关注,而“财务会计信息有没有用”这样一个挑战性的问题出现了。所以早期的实证会计研究主要是从有效市场假设(EMH)和资本资产定价模型(CAPM)出发,检验财务会计数据与其他经济指标(特别是股价)的关系,如果财务会计指标(特别是会计收益指标)与股票价格相关,则说明会计信息的披露对证券市场的资源配置功能有效。后来这一结论被实证研究所证实,这有效地驳斥了“会计无用论”,从而奠定了实证会计研究的地位。近年来,会计政策选择成为实证会计研究的重心,以解释和预测企业“为什么会选择这种会计政策,而不采取那种会计政策”。例如:会计政策选择与企业规模、地区分布、资本结构、分红计划。债务契约的关系;企业的外部利益关系人对会计信息反应的研究等,如果将上述问题给予抽象,它们都涉及“变量间的相互关系”这样一个可以归结为数学的问题。所以,针对上述问题,在研究随时间变化、具有随机性而又前后相互关联的动态数据时,用到时间序列分析,它包括建立时间序列模型(ARIMA模型)、参数估计及谱估计等理论与方法。在讨论多元变量之间是否存在线性相关时,运用多元线性回归模型、典型相关分析和残差检验。由于正态分布在会计数据中广泛存在,例如,以任一会计科目作为总体,则不同时期该科目数额特别巨大和特别小(如为零)的比较少,则可以视之符合正态分布等,所以与正态分布相关的检验方法被大量使用:检验母体均值与原假设均值是否具有显着差异的U一检验,检验两个母体均值是否相等的T一检验,检验母体的方差与原假设方差是否具有显着差异的X2一检验,检验两个正态母体方差是否相等的F一检验。对不确定的母体分布采用非参数统计方法,如非参数检验。国外实证研究证实股票价格波动具有马尔可夫性,即在有效的资本市场中现在的股票价格已反映了以往和现在的全部经济信息,以前的股价行料对将来的股价波动不再具有信息价值,“将来”只与“现在”有关,而与“过去”无关。解决这方面问题的模型有:回归一马尔可夫模型、随机游动模型。
2.理财、管理会计研究领域
现代理财论,总的说来是围绕估价问题而展开的,这里所说的估价,既包括对个别“资本资产”的估价,也包括对企业总体价值的估价。如探讨投资风险和投资报酬的投资组合理论(Portfolia Theory),后来该理论又发展为资本资产定价模型(CAPM),套利定价理论(Arbitrage Pricing Theroy)、探讨资本结构与企业总价值关系的资本结构理论(Capital Structure Theory)、MM(Modigliani, Miller)理论、米勒模型(Miler Model)等。其中广泛应用了微积分、线性代数及概率论与数理统计。针对创新金融工具的估价模式——期权定价模型则广泛地应用了偏微分方程、随机微分方程及倒向随机微分方程等较为先进、复杂的数学理论与方法。
管理会计主要是利用信息来预测前景,参与决策。筹划未来,控制和评价经济活动等,保证以较少的劳动消耗和资金占用,取得较好的经济效益。管理会计应用的数学方法也相当广泛,例如预测成本和销售额时采用回归分析,评价企业财务状况、投资效益时采用层次分析法,预测经营状况是采用具有吸收状态(企业破产)的马尔可夫链。另外还有“经济定货量”模型、“经济生产量”模型、敏感分析、弹性分析等,则是应用微分学解决经济问题的一些典范。管理会计中许多问题可以归结为:数学分析中的极值问题;数学规划中一定约束条件下的目标函数的最值问题;马尔可夫相关理论问题;在约束条件和目标函数不能用线性方程或线性函数表示时的非线性规划问题;在解决多阶段决策问题时的动态规划问题;解决如何经济、合理地设置服务设施,从而以最低成本最大地满足顾客需要问题时的排队论问题,如人力资源选择,机器设备选购等;导源于宏观经济管理并在微观经济管理中也有广泛地应用的投入——产出分析问题,例如,用于多阶段生产条件下生产与成本计划的制定。
3.审计研究领域
审计主要是通过对财务会计信息的鉴证,以增强信息使用者对财务会计信息信任程度。在审计中最常用的数学方法是抽样技术。随着统计科学和企业规模的不断发展,许多会计公司将统计抽样理论与审计相结合,设计出了审计抽样技术。对受审单位的内部控制制度有效性进行符合性测试时,采用属性抽样,如连续性抽样,发现抽样。在实质性测试中采用变量抽样,如分层随机抽样及累计概率比例抽样法(PPS),这对于减少审计风险和成本,提高审计工作效率和效果意义重大,因为严格遵循随机原则抽取样本,根据总体容量、误差率、精确度、可信水平等因素综合分析得到样本容量,其分布规律更加接近于审计总体的分布规律。另外,在预测突发事件或不确定性问题时,历史数据或既定的模型并不能完全反映它们,在这种情况下还要结合专家的专业判断、经验进行预测,也就是说,这一步的后验分布又是下一步先验分布的基础,不断对模型进行修正使之“动态化”,以提高预测精度。近年来,判别分析模型和聚类分析模型在国外也开始引入审计研究领域。对于定性资料的统计分析方面,Logit模型和probit模型被广泛应用,例如用于预测注册会计师签署审计意见类型等。
值得注意的是,当人们寻求用定量方法处理复杂经济问题时,容易注重于数学模型的逻辑处理,而忽视数学模型微妙的经济含义或解释,实际上,这样的数学模型看来理论性很强,其实不免牵强附会,从而脱离实际。与其如此,不如从建模型一开始就老实承认数学方法的不足,而求助于经验判断,将定性的方法与定量的方法相结合,最后定量。
E. 模拟马尔可夫链
蒙特卡罗(Monte Carlo)是世界着名的[赌城],是摩纳哥的标志。富丽堂皇的蒙地卡罗赌场,建于一八六三年,是一幢古色古香以及巍峨的宫殿式建筑物,再加上山明水秀,使游客抵达门前,立即发生好感。门前有一大片广场,是一个花圃,一草一木都修剪整齐,鲜花盛放,七彩缤纷,园旁有一停车场,园尽处一间宫殿式的建筑便是闻名世界的蒙地卡罗赌场了。登台阶入门,站着警卫把守。照摩纳哥法律,本国人不准入内赌博,观光客自然欢迎,然后凭护照交十法朗便成为[一日]的[会员],凭此证才能进入赌场。场内气派堂皇,墙上的装饰与帷幕,加上白天也亮的钻石般闪烁的水晶灯,满铺的红地毯烘托着,穿着整齐礼服的侍者,气氛上是不同凡响。内有适合歌剧表演的大舞台,再过一道门进入一间大厅,便是着名的赌场了。
赌场几乎等于是蒙特罗的小缩影,不管您赌不赌博,如果来到蒙特卡罗没到赌场走一遭,或者试一下手气,那可真是有入宝山空手而返的感觉。只要下点小赌注,看桌上筹码搬家的声音,想象着财富不知几时会向您面前推过来,那种经验和感觉,就值得日后向儿孙辈夸上老半天了。
蒙特卡罗赌场以轮盘为主,现在虽加入其他赌具,但轮盘赌仍最受人欢迎。它受欢迎的理由之一,是赌客有较多获胜机会。这里的轮盘和其他赌场里稍有不同:这里的轮盘赌只有一个零(庄家统吃)而其他地方则有两个零。蒙特卡罗现有轮盘赌十八桌,每个轮盘上有卅七孔(卅六个数字加上零),可容纳小象牙球的落入。赌客们可以在任何数字上下注,如果胜了,庄家付出卅五倍的钱。也可以赌单数或双数,红格或黑格(每一个孔的颜色是红黑相间的),如果下这一类的注,胜了可得与财相同的钱,不过获胜的机会是一比一的。零点的颜色是绿的,要是出了这个数,庄家除了赔系在零字上的赌注外,其他台上各门统吃。单只这个零点便给庄家带来百分之二点七的获胜机会,虽然不多,但已足够维持赌场的开支与盈利了
F1赛事中历史最悠久的就是摩纳哥大奖赛。自1950 年F1大赛在这里问世以来,风景优美的蒙特卡洛城街道已经49次作为F1大奖赛的赛道。这里没有看台,有居民甚至自豪地说,他是站在自己家的阳台上观看比赛的。这里平时是街道,等到正式比赛才加上防护墙,组成了临时赛道。正是这样的原因,这条赛道自1950 年以来几乎没有做过改动。
“这是一条一点错误都不能有的赛道。”舒马赫指出:“对赛车的调教必须十分小心,以应付赛道的每一种特点。我的经验是稳定性在摩纳哥是最为重要的一个方面。”驾驭马力强大的F1赛车78次穿越狭窄的街道完成这站比赛对车手来说确实是一次充满刺激的挑战。难怪有人将摩纳哥大奖赛称为F1“王冠上的明珠”,在这里夺得冠军的车手无意中也会被车迷们“看高”一个档次
现在在学术上称一种随机现象为蒙特卡罗现象
F. 数学建模
论文:运用统计和概率方法分析美国GDP运行走势
字体大小:大 | 中 | 小 2009-03-17 11:14 - 阅读:37 - 评论:0
撰稿时间:2008年11月
摘要:以美国近几十年的Real GDP(实际GDP)季度变化百分比作为离散型随机变量,运用统计和概率方法,利用马尔可夫链模型,按照变化幅度剧烈与缓慢进行量化、建模,从以往的几十年实际GDP变化规律,预测未来一两年内美国实际GDP变化走势。
关键字:GDP;概率;统计;马尔可夫链;转移概率;经济预测
1 引言
概率论与数理统计是研究随机现象客观规律性的数学学科,它的理论和方法已广泛地应用于自然学科、技术科学和社会科学的各个领域,尤其在天气预报、地质勘探等领域有着广泛的应用。着名经济学家特里夫·哈维默就认为全部经济规律都可以用概率的方法来描述。各种经济数据可以看作是一系列相互影响或者独立的随机变量,而经济数据的变化则是一个个错综复杂的随机过程。随着全球经济的融合和金融信息化,概率论在宏观经济预测、调控以及统计提供有效参考数据等方面将发挥越来越重要的作用。
国内生产总值(Gross Domestic Proct,GDP),是衡量一个国家经济运行好坏的最重要的经济运行指标之一。本文从概率论学角度出发,分析美国1947年以来近几十年的实际GDP(Real GDP)变化情况,从变化的幅度大小和变化的时间跨度两方面入手,将实际GDP变化百分比转化为在有限状态空间内变化的离散型随机变量。这个随机变量在状态空间内转移的过程也就是实际GDP随时间变化的随机过程,构建出实际GDP变化的马尔可夫链模型。从而根据建立的概率模型来预测随机变量的下一步的转移情况,得到的就是未来实际GDP的运行走势。大致的分析与预测过程可以描述为:数据处理->统计与分析->建立数学模型->得出结论。
2 对GDP的分析与建模
美国是全球最发达的经济体,对美国经济发展的运行指标进行研究和考察,不仅能揭示出美国经济周期本身的特点,还可以对经济运行起到良好的分析和借鉴作用,对世界各国宏观经济的运行预测和干预提供帮助。而且美国经济指标体系的完备程度也最高,作为重要的公共信息定期发布和修正,从理论分析上保证了数据的可靠性和充分性。
国内生产总值(Gross Domestic Proct,GDP):是指一国生产的全部最终产品和服务的总值。GDP是目前各个国家和地区用来衡量该国或地区的经济发展综合水平通用的指标,反应一个国家总体经济状况的一张最为重要、综合性最强的晴雨表。通常所说的GDP是指名义GDP(Normal GDP),而实际GDP(Real GDP)考虑到了通货膨胀导致价格上升的因素,相对而言更准确的反应了一个国家的经济发展。美国经济分析局[1](Bureau of Economic Analysis)提供的多种GDP指标中以不同的权重来衡量,此次分析选择了实际GDP季度变化百分比(Percent Change From Preceding Period in Real Gross Domestic Proct [Index numbers, 2000=100]),更关注的是GDP的波动变化。美国GDP数据每个季度公布一次,此次考察区间为1947年第2季度至2008年第3季度期间实际GDP变化百分比(见表1),用数学公式描述为一个离散的序列:t是表示季度的排序序号,从零开始;X表示实质GDP变化百分比
研究经济数据的运行过程,也是构造数学模型的过程,必然以大量的数据统计为基础。连续62年共246个季度的GDP变化百分比能够反应了美国相当长时期内的GDP走势,因此可以作为对今后一定长时期内GDP变化分析的数据依据[2]。
2.1 对GDP变化的直观分析
由于经济现象中经济变量的变化错综复杂,必然带有一定的随机“干扰”,因此需要先对随机变量分布作一定的假定。首先,使用微软EXCEL软件将上述变化百分比序列以散点图形式绘制出来(见图1)。从图上可以直观分析得出:美国连续62年以来,实际GDP变化百分比大体上经历着“上升-下降-上升-下降”的不断重复的特性,所不同的是,时间跨度和上升或下降的幅度不同。结合美国经济发展历史,在这62年期间美国经济经历了 “增长->衰退->增长->衰退”随机往复特性。当处于经济危机阶段或者经济滞胀时期,实际GDP变化百分比就会发生连续大幅上下震荡的趋势,而当经济处于平稳发展阶段,实际GDP变化百分比呈现小幅上下震荡趋势。由此可以根据实际GDP变化幅度反向推断经济运行趋势。
2.2构建GDP变化的马尔可夫链模型
马尔可夫(Markov)过程是用于分析随机过程的理论方法,对于时间和状态都是离散的马尔可夫过程称为马尔可夫链。马尔可夫链模型通常用于统计学中的建模,在自然生物人口过程、商品市场占有率变化、以及天气变化方面都有非常广泛的应用。如果某一时刻系统状态的概率分布只与前一时刻的状态有关,与以前的状态无关,则该系统符合马尔可夫性或者无后效性。实际GDP变化百分比受到很多外部经济变量如战争、宏观调控政策等各种因素的影响,变化呈现随机特性,因此可以认为短期内未来实质GDP变化百分比只与当前阶段的实质GDP变化有关,符合马尔可夫性。
为了描述实际GDP百分比的变化幅度,先要对看似随机变化的数据进行量化,幅度大小对百分比进行如下量化定义:
状态1:大幅增长(一次或者连续几次增长幅度超过7,包括边界值);
状态2:大幅下降(一次或者连续几次下降幅度超过7,包括边界值);
状态3:小幅增长(一次或者连续几次幅度增长大于1并且小于7);
状态4:小幅下降(一次或者连续几次幅度下降大于1并且小于7);
可以看出,区分大幅增长还是小幅度增长的变化幅度范围对概率统计起到决定因素,不同的量化标准产生的统计结果也会不一样。另外,在图1中可以看到有些相邻的时间点变化幅度非常微小,这里把这个叫做干扰,把前后相邻变化幅度小于1的序列点视为干扰信号,近似认为后一个序列点状态保持不变。如果将这种细微变化也算作小幅增长或者小幅下降,将会放大干扰信号的作用。这样实质GDP变化百分比就转化成了一个在1、2、3、4有限状态空间内变动的离散的时间序列。如果只关注状态变化趋势和经历的时间,则只需要记录状态发生变化的134个序号以及发生的时间点即可,这样一个新的状态序列描述为:s代表排序序号,从零开始;t代表状态发生变化的季度序号;Y代表状态。
用Microsoft Excel的散点图形式描绘的实际GDP变化状态(见图2)能够更直观的观察实际GDP变化幅度在有限个状态空间内的变化情况:
对上述状态序列Y(t)进行统计,可以得出各状态之间一步转移的次数,进而计算出各状态之间一步转移概率和一步转移矩阵P。另外,为了得到状态发生一步转移所经历的时间跨度,需要计算出相应的状态转移的时间差,即当tn到tn+1时,状态从Yn转移到Yn+1,则对应的时间跨度为sn+1-sn,通过简单的求平均值的方法求出所有一步状态转移对应的平均时间跨度(见表3),时间跨度以季度为一个单位。
状态转移 转移次数 一步转移概率 平均时间跨度
状态1到状态2 10 0.476 2.3
状态1到状态4 11 0.524 2.3
状态2到状态1 13 0.542 2.2
状态2到状态3 11 0.458 1.9
状态3到状态2 14 0.304 1.6
状态3到状态4 32 0.696 1.8
状态4到状态1 7 0.167 1.3
状态4到状态3 35 0.833 1.6
总计133次(表3:实际GDP状态一步转移统计结果)
2.3 根据马尔可夫模型对近期美国GDP变化进行预测
当前实质GDP变化的状态是4,根据上述转移矩阵和每次转移所经历的时间跨度可以得出近期发生状态转移的结果,即近期实质GDP变化幅度和大致所需要经历的时间。
当前状态 转移步数 目标状态 转移概率 平均时间跨度
4 2 2 0.333 3.4
4 2 4 0.667 3.5
4 3 1 0.292 5.3
4 3 3 0.708 5.2
表4:马尔可夫链模型对实质GDP变化的预测结果
模型给出的预测结果显示:美国实际GDP当前处于小幅下降阶段,经过2次转移后,大约在未来3~4个季度内,会出现两种变化走势,小幅下跌和大幅下跌,发生的可能性分别为66.7%和33.3%。经过3次转移后,大约在未来5~6季度会发生小幅增长和大幅增长,发生的概率分别为70.8%和29.2%。由此分析得出,未来3~4个季度内(目前为2008年11月)美国经济肯定会出现衰退,出现大幅幅度衰退的可能性高达66.7%;而经济恢复则需要在未来5~6季度内发生,缓慢回升的概率更大,占70.8%,由此看来美国未来一两年内经济形式面临严峻考验。
3 总结
概率论作为一门研究随机现象的数量规律学科,通过将金融经济中的数据以概率论方法统计分析后,可以关系到各个国家经济导向。今后将逐渐在经济中发挥着重要的作用。马尔科夫分析法是研究随机事件变化趋势的一种方法。经济运行数据的变化也经常受到各种不确定因素的影响而带有随机性,若其具有“无后效性”,则可以用马尔科夫分析法对其未来发展趋势进行宏观趋势分析。实际GDP季度变化百分比是一个固定时间间隔的幅度大小发生变化的随机过程,因此用马尔可夫链模型分析其变化趋势是比较符合这一类应用。首先对实际GDP季度变化百分比按照变化幅度划分有限个状态的状态空间,然后对状态之间的一步转移情况进行统计,进而计算出实际GDP变化的一步转移概率矩阵。由这个概率矩阵和当前状态就可以推算出GDP变化下一个状态是什么,其概率为多少,也就是未来的实际GDP变化走势。
任何模拟自然界数据的一种模型都会存在一定的误差,不同的是误差的大小不同而已。本文在数据处理阶段即概率状态空间的划分过程中,由于不同的量化标准产生的统计结果也不一样,因此会损失了部分样本,产生了一定的误差。
本文的概率分析过程仅针对众多经济运行指标中的一个进行,实际的经济运行体包括多个经济衡量指标,比如消费者物价指数、通货膨胀率、失业率等等,它们之间相互关联和影响,如果想更准确的得到经济运行走势,可以对多个经济指标逐个分析,然后对每个分析和预测结果再进行综合评测。
4标注
[1] 美国经济分析局BEA(Bureau of Economic Analysis):BEA的功能主要是分析和综合大量数据以便创造美国经济的一个连贯模式。BEA还对国际、国家和地区的经济进行预算和分析。其中以对国民生产总值(GDP)的预算最为着名。
[2] 美国实际GDP季度变化百分比仅从1947年开始有记载,因此数据有限,仅对未来短期内的GDP变化预测起到借鉴作用,对分析未来长期宏观经济形式可能会有局限性。
5参考文献
[1],高鸿生,《西方经济学(宏观部分)第四版》,中国人民大学出版社,2007
[2] 隋亚莉,李鸿儒,《经济数学基础--概率统计(第3版)》,清华大学出版社
[3] 范晓志, 宋宪萍,概率论在经济生活中的多维应用,《统计与决策》,2005,(8)
[4] 杨曾武,《统计预测原理》,中国财政经济出版社,1990
[5] 郝艳茹,马尔可夫链理论与市场占有率分析和预测,《上海统计》,2000,(1)
http://kittyzhang007.blog.bokee.net/bloggermole/blog_viewblog.do?id=2748601
G. 加权马尔科夫链是什么原理
由于每个时段的股票价格序列是一列相依的随机变量,各阶自相关系数刻画了各种滞时(各个时段)的股票价格之间的相关关系的强弱。因此,可考虑先分别依其前面若干时段的股票价格(对应的状态)对该时间段股票价格的状态进行预测,然后,按前面各时段与该时段相依关系的强弱加权求和来进行预测和综合分析,即可以达到充分、合理地利用历史数据进行预测的目的,而且经这样分析之后确定的投资策略也应该是更加合理的。这就是加权马尔可夫链预测的基本思想。
H. 马尔科夫链在经济预测和决策中的应用
马尔科夫链对经济预测和决策是通过模型来进行的。
马尔可夫链,是指数学中具有马尔可夫性质的离散事件随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的。
马尔科夫链是一种预测工具。适宜对很多经济现象的描述。最为典型的就是对股票市场的分析。有人利用历史数据预测未来股票或股市走势,发现并不具备明显的准确性,得出的结论是股市无规律可言。
经济学者们用建立马尔科夫链模型来进行预测和决策,一般分为三步,设定状态,计算转移概率矩阵,计算转移的结果。