摘 要 研究了沪深300指数日收益率时间序列,经检验其具有马氏性,并建立了马尔可夫链模型。取交易日分时数据,根据分时数据确定状态初始概率分布,通过一步转移概率矩阵对下一交易日的日收益率进行了预测。对该模型分析和计算,得出其为有限状态的不可约、非周期马尔可夫链,求解其平稳分布,从而得到沪深300指数日收益率概率分布。并预测了沪深300指数上涨或下跌的概率,可为投资管理提供参考。 关键词 马尔可夫链模型 沪深300指数 日收益率概率分布 平稳分布 1 引言 沪深300指数于2005年4月正式发布,其成份股为市场中市场代表性好,流动性高,交易活跃的主流投资股票,能够反映市场主流投资的收益情况。众多证券投资基金以沪深300指数为业绩基准,因此对沪深300指数收益情况研究显得尤为重要,可为投资管理提供参考。 取沪深300指数交易日收盘价计算日收益率,可按区间将日收益率分为不同的状态,则日收益率时间序列可视为状态的变化序列,从而可以尝试采用马尔可夫链模型进行处理。马尔可夫链模型在证券市场的应用已取得了不少成果。参考文献[1]、[2]、[3]和[4]的研究比较类似,均以上证综合指数的日收盘价为对象,按涨、平和跌划分状态,取得了一定的成果。但只取了40~45个交易日的数据进行分析,历史数据过少且状态划分较为粗糙。参考文献[5]和[6]以上证综合指数周价格为对象,考察指数在的所定义区间(状态)的概率,然其状态偏少(分别只有6个和5个状态),区间跨度较大,所得结果实际参考价值有限。参考文献[7]对单只股票按股票价格划分状态,也取得了一定成果。 然而收益率是证券市场研究得更多的对象。本文以沪深300指数日收益率为对考察对象进行深入研究,采用作为计算工具,对较多状态和历史数据进行了处理,得出了沪深300指数日收益率概率分布,并对日收益率的变化进行了预测。 2 马尔可夫链模型方法 马尔可夫链的定义 设有随机过程{Xt,t∈T},T是离散的时间集合,即T={0,1,2,L},其相应Xt可能取值的全体组成状态空间是离散的状态集I={i0,i1,i2,L},若对于任意的整数t∈T和任意的i0,i1,L,it+1∈I,条件概率则称{Xt,t∈T}为马尔可夫链,简称马氏链。马尔可夫链的马氏性的数学表达式如下: P{Xn+1=in+1|X0=i0,X1=i1,L,Xn=in}=P{Xn+1=in+1|Xn=in} (1) 系统状态概率矩阵估计 马尔可夫链模型方法的基本内容之一是系统状态的转移概率矩阵估算。估算系统状态的概率转移矩阵一般有主观概率法和统计估算法两种方法。主观概率法一般是在缺乏历史统计资料或资料不全的情况下使用。本文采用统计估算法,其主要过程如下:假定系统有m种状态S1,S2,L,Sm根据系统的状态转移的历史记录,可得到表1的统计表格。其中nij表示在考察的历史数据范围内系统由状态i一步转移到状态j的次数,以■ij表示系统由状态i一步转移到状态的转移概率估计量,则由表1的历史统计数据得到■ij的估计值和状态的转移概率矩阵P如下: ■ij=nij■nik,P=p11 K p1mM O Mpm1 L pmn(2) 马氏性检验 随机过程{Xt,t∈T}是否为马尔可夫链关键是检验其马氏性,可采用χ2统计量来检验。其步骤如下:(nij)m×m的第j列之和除以各行各列的总和所得到的值记为■.j,即: ■.j=■nij■■nik,且■ij=nij■nik(3) 当m较大时,统计量服从自由度为(m-1)2的χ2分布。选定置信度α,查表得χ2α((m-1)2),如果■2>χ2α((m-1)2),则可认为{Xt,t∈T}符合马氏性,否则认为不是马尔可夫链。 ■2=2■■nijlog■ij■.j(4) 马尔可夫链性质 定义了状态空间和状态的转移概率矩阵P,也就构建了马尔可夫链模型。记Pt(0)为初始概率向量,PT(n)为马尔可夫链时刻的绝对概率向量,P(n)为马尔可夫链的n步转移概率矩阵,则有如下定理: P(n)=PnPT(n)=PT(0)P(n)(5) 可对马尔可夫链的状态进行分类和状态空间分解,从而考察该马尔可夫链模型的不可约闭集、周期性和遍历性。马尔可夫链的平稳分布有定理不可约、非周期马尔可夫链是正常返的充要条件是存在平稳分布;有限状态的不可约、非周期马尔可夫链必定存在平稳过程。 3 马尔可夫链模型方法应用 观测值的描述和状态划分 取沪深300指数从2005年1月4日~2007年4月20日共555个交易日收盘价计算日收益率(未考虑分红),将日收益率乘以100并记为Ri,仍称为日收益率。计算公式为: Ri=(Pi-Pi-1)×100/Pi-1(6) 其中,Pi为日收盘价。 沪深300指数运行比较平稳,在考察的历史数据范围内日收益率有%在[,]。可将此范围按的间距分为18个区间,将小于和大于各记1区间,共得到20个区间。根据日收益率所在区间划分为各个状态空间,即可得20个状态(见表2)。 马氏性检验 采用χ2统计量检验随机过程{Xt,t∈T}是否具有马氏性。用前述统计估算法得到频率矩阵(nij)20×20。 由(3)式和(4)式可得:■.j=■nij■■nik,且■ij=nij■nik,■2=2■■nijlog■ij■.j=,令自由度为k=(m-1)2即k=361,取置信度α=。由于k>45,χ2α(k)不能直接查表获得,当k充分大时,有: χ2α(k)≈■(zα+■)2(7) 其中,zα是标准正态分布的上α分位点。查表得,故可由(1)、(7)式得,即统计量,随机过程{Xt,t∈T}符合马氏性,所得模型是马尔可夫链模型。 计算转移概率矩阵及状态一步转移 由频率矩阵(nij)20×20和(1)、(2)式得转移概率矩阵为P=(Pij)20×20。考察2007年4月20日分时交易数据(9:30~15:30共241个数据),按前述状态划分方法将分时交易数据收益率归于各状态,并记Ci为属于状态i的个数,初始概率向量PT(0)=(p1,p2,L,pt,L,p20),则: pj=Cj/241,j=1,2,K,20(8) 下一交易日日收益率分布概率PT(0)={p1(1),p2(1),L,pi(1),L,p20(1)},且有PT(1)-PT(0)p,计算结果如表3所示。 马尔可夫链遍历性和平稳分布 可以分析该马尔可夫链的不可约集和周期性,从而进一步考察其平稳分布,然而其分析和求解非常复杂。本文使用采用如下算法进行求解:将一步转移概率矩阵P做乘幂运算,当时Pn+1=Pn停止,若n>5 000亦停止运算,返回Pn和n。计算发现当n=48时达到稳定,即有P(∞)=P(48)=P48。考察矩阵P(48)易知:各行数据都相等,不存在数值为0的行和列,且任意一行的行和为1。故该马尔可夫链{Xt,t∈T}只有一个不可约集,具有遍历性,且存在平稳分布{πj,j∈I},平稳分布为P(48)任意一行。从以上计算和分析亦可知该马尔可夫链是不可约、非周期的马尔可夫链,存在平稳分布。计算所得平稳分布如表4所示。 计算结果分析 表3、表4给出了由当日收益率统计出的初始概率向量PT(0),状态一步预测所得绝对概率向量PT(1)和日收益率平稳分布,由表3和表4综合可得图1。可以看出,虽然当日(2007年4月20日)收益率在区间(,)波动且在(,)内的概率达到了,表明在2007年4月20日,日收益率较高(实际收盘时,日收益率为),但其下一交易日和从长远来看其日收益率概率分布依然可能在每个区间。这是显然的,因为日收益率是随机波动的。 对下一交易日收益率预测(PT(1)),发现在下一交易日收益率小于0的概率为,大于0的概率为,即下一交易日收益率大于0的概率相对较高,其中在区间(-2,)、(,1)和(1,)概率、和依次排前三位,也说明下一交易日收益率在(-2,)的概率会比较高,有一定的风险。 从日收益率长远情况(平稳分布)来看,其分布类似正态分布但有正的偏度,说明其极具投资潜力。日收益率小于0的概率为,大于0的概率为,即日收益率大于0的概率相当的高于其小于0的概率。 4 结语 采用马尔可夫链模型方法可以依据某一交易日收益率情况向对下一交易日进行预测,也可得到从长远来看其日收益率的概率分布,定量描述了日收益率。通过对沪深300指数日收益率分析和计算,求得沪深300指数日收益率的概率分布,发现沪深300指数日收益率大于0的概率相对较大(从长远看,达到了,若考虑分红此概率还会变大),长期看来沪深300指数表现乐观。若以沪深300指数构建指数基金再加以调整,可望获得较好的回报。 笔者亦采用范围(-5,5)、状态区间间距为1和范围(-6,6)、状态区间间距为2进行运算,其所得结果类似。当采用更大的范围(如-10,10等)和不同的区间大小进行运算,计算发现若状态划分过多,所得模型不易通过马氏性检验,如何更合理的划分状态使得到的结果更精确是下一步的研究之一。在后续的工作中,采用ANN考察所得的日收益率预测和实际日收益率的关系也是重要的研究内容。马尔可夫链模型方法也可对上证指数和深证成指数进行类似分析。 参考文献 1 关丽娟,赵鸣.沪综指走势的马尔可夫链模型预测[J].山东行政学院,山东省经济管理干部学院学报,2005(4) 2 陈奕余.基于马尔可夫链模型的我国股票指数研究[J].商场现代化(学术研讨),2005(2) 3 肖泽磊,卢悉早.基于马尔可夫链系统的上证指数探讨[J].科技创业月刊,2005(9) 4 边廷亮,张洁.运用马尔可夫链模型预测沪综合指数[J].统计与决策,2004(6) 5 侯永建,周浩.证券市场的随机过程方法预测[J].商业研究,2003(2) 6 王新蕾.股指马氏性的检验和预测[J].统计与决策,2005(8) 7 张宇山,廖芹.马尔可夫链在股市分析中的若干应用[J].华南理工大学学报(自然科学版),2003(7) 8 冯文权.经济预测与决策技术[M].武汉:武汉大学出版社,2002 9 刘次华.随机过程[M].武汉:华中科技大学出版社,2001 10 盛千聚.概率论与数理统计[M].北京:高等教育出版社.1989转