摘要:产业在地理空间上的集聚现象已经成为许多学科领域研究关注的焦点,从一般经济学理论、产业经济学、区域经济学、国际贸易理论、管理学到空间经济学理论都有从各自领域对产业在地理空间上集聚有所解释。我们从江苏沿江产业集聚现象的形成和发展着手研究,试图以地理集中度为衡量指标,以制造业为例,根据各学科的相关理论对产业集聚的形成原因进行剖析,指出影响江苏沿江制造业产业集聚的因素。实证结果说明,本地市场规模、产业关联和FDI是影响江苏沿江产业集聚形成的显著因素。关键词:产业集聚;经济地理;因素分析Abstract: This paper examines the micro-foundations of agglomeration economies for Jiangsu industries. Using industries as observations, we regress the LQ measure of spatial concentration on industry characteristics that proxy for the presence of market scale, labor market pooling, input sharing, product shipping costs, natural advantage, FDI and infrastructure construction. Results indicate that proxies for market scale, input sharing and FDI have the most robust effect, positively influencing words: industrial agglomeration; distribution; important factor产业集聚是市场经济条件下伴随着地区工业快速发展的结果,是一个国家或地区产业竞争力的重要来源和集中体现。从著名的美国硅谷、波士顿128公路到英国的剑桥工业园,以色列的特拉维夫地区等等,都是很有代表性的竞争力很强的产业集聚区域。我国自改革开放以来,在对外开放、市场化取向的体制改革推动下,经济活动的空间分布也发生了很大的变化。逐渐形成了一些制造业集聚的中心、一批高集聚、高度专业化的产业集群。代表我国产业空间集聚最迅速的珠江三角洲区域、长江三角洲区域也是我国经济发展最快的区域。产业在空间的分布趋向于在一些地区集聚,在其他地方分散。那存在这种产业分布的空间上的集聚的原因究竟是什么呢?本文在前人文献研究的基础上,试图结合江苏沿江制造业产业集聚的模式,从新经济地理学的角度找出集聚形成的原因。文章第一部分回顾现有文献,介绍对于制造业产业集聚的研究方法、相关理论;第二部分介绍本文的对产业集聚的分析框架;第三部分对中国制造业的集聚现状描述;第四部分是产业空间集聚与相关因素的计量分析及结果;第五部分是文章的结论和政策建议。一、产业集聚及相关理论对于制造业产业在空间集聚的因素研究很多,国外很多研究从不同的理论角度都曾给过解释。从早先马歇尔从外部规模经济的角度阐述了产业集聚的原因,韦伯从集聚带来成本节约的角度解释集聚的产生,到现在的新产业区位论、新贸易理论、新地理经济学等等都对产业集聚做出解释。(一)产业集聚的定义产业在空间上聚集的现象已经是很多学科的共同关注的焦点。但对产业聚集的定义、产生原因、甚至产业聚集的衡量方法,都没有一致的认定。本文将对产业聚集的定义综合现有的研究成果,在不同领域的共性的基础上,总结出几个方面的定义。1.从空间角度看,产业聚集是发生在某一特定地理区域内的经济过程或现象。2.从产业角度看,产业聚集区域内的企业是属于某几种产业或具有直接上下游产业关联或具有其他密切联系的相关产业的企业。3.从相互关系角度看,产业聚集区域内的企业彼此之间必须以各种可能的方式产生互动,使聚集区域内厂商表现较其他非聚集区域的厂商更好。波特(Porter 1990,1998,2002)的定义是:“产业集群指一群特定产业领域内相关联的企业、生产供应商、服务供应商、相关产业厂商及相关机构(如大学、制定标准化的机构、金融机构、贸易协会等)以彼此既竞争又合作的方式在某一地理区内集中的现象”。(二)产业集聚的形成原因综合前人的研究成果,笔者认为以下几个方面是影响我国产业集聚的重要因素:1.资源要素资源要素包括区位要素和生产要素。区位要素指的是具体产业相关的或必须的自然区位、交通区位、经济区位。从理论上看,企业一般倾向于选择聚集再交通要塞,以降低运输成本。生产要素就包含自然资源和社会资源。产业集聚的的形成表现为区域专业化生产,根据赫克歇尔-俄林理论,区域专业化生产的主要原因是自然资源禀赋。早期的产业集聚形成过程中,自然资源起到了根本性的作用。后来的研究证实,相对于早期自然资源,社会资源的作用在后期产业集聚的形成中,具有更大的作用。包括技术、人才、社会网络、文化、制度等社会资源具有不可量化和无限性,已经成为产业集聚形成的关键因素。2.需求条件靠近特定的市场也是产业集聚形成的重要原因。在一定程度上,接近市场有利于厂商掌握客户偏好,有利于厂商掌握新产品信息与走向,这个过程同时也能够促进厂商对产品或服务的升级,增强自己产业的竞争力。市场需求是产生集聚的动力,同时,市场需求也促使着产业的专业化分工过程。根据斯杨定理,专业化分工会提高效率,企业可以获得递增报酬,但由于其受到市场容量的制约,只有市场容量达到最初的临界点才有可能触发专业化分工自我强化的过程。产业集聚才可能持续良性发展。3.外部经济环境“自发性”是产业集聚形成的一个最根本的特征,而这样自发形成的基础是市场机制。市场自由度越高,外向化程度越高,政府的不合理管制程度越低,产业集聚的效应就越能发挥出来。我国对产业集聚的研究中,经济体制因素是我国特色的一个重要影响因素。随着我国市场化程度逐步提高,产业集聚在我国形成的外部经济环境已经越来越好。实践证明,产业集聚在生产、流通两方面都离不开开放的市场环境。产业集聚的形成和经济开放存在这样的关系:凡是经济开放程度高、市场竞争力量强的地区,产业集群的特征就比较突出;凡是经济相对封闭、市场竞争力量弱的地区,产业集群现象就比较弱(徐康宁,2001)。4.产业特征反映产业特征的很多因素如技术溢出因素、产业规模等都是产业集聚形成的重要因素。在产业集聚的形成过程中,通过技术溢出,以带动整个集聚群内部的技术创新能力的提高。技术水平的提高使得区域内的企业特别是学习型企业得到发展的动力,促进与区域内其他企业的合作,推动技术创新的良性循环,推动技术水平的整体提高。技术进步也是实现集聚区企业升级可持续发展的动力。5.政府政府对产业集聚发展的影响是非常重要的。政府通过对某个地域或某个产业制定的种种优惠措施,对产业集聚形成起着非常关键的作用,这在发展中国家尤为明显。此外,政府的教育、文化、税收等政策都可能影响到生产要素,从而影响产业的集聚的形成、发展。(三)地理集中度的衡量指标衡量区域内企业集中度有很多指标,地理经济学上是地理集中度衡量指标,此处借用区位商(Location Quotient)来衡量产业集聚。区位商是产业效率与效益分析的定量工作,是较普遍的识别地区制造业专业化的方法,是衡量某一产业的某一方面,在特定区域专业化程度的方法,也可以说明各地区各产业的相对集聚程度。起计算公式如下:二、对产业集聚的分析与变量的选取近几年,江苏的产业集群发展迅速,苏州工业园区和高新区、南京江宁开发区、昆山高新区等初具规模。产业集群效益在江苏已经凸显。以沿江高新技术产业带为例,据统计,2004年,高新技术产业带实现产值超过2 000亿元。该产业带创造了江苏八成以上的信息产业产值和15%的工业总产值。总的看来江苏省产业集群这些年的发展前景令人鼓舞:一是有一定的规模,目前江苏成型的产业集群约有一百多个;二是行业分布比较广,几乎涉及了纺织、服装、金属制品、电器、建材、轻工等传统行业,也有IT、环保等新兴产业;三是分布比较广泛,苏南、苏中、苏北三大板块都在各个经济领域都有分布;四是已经形成一批品牌,在全国有一定的知名度和比较高的市场占有率。产业集群已成为江苏经济发展的强劲支撑。影响产业集聚形成的因素很多,从前文的叙述和考虑到数据的可得性,我们假设的与产业集聚形成有关是资源要素、需求条件、产业特征、外部经济环境、政府等。本文选取数个相关指标来分析产业空间集聚的决定设立以下联立方程:EDU为该地区的大专以上学历人口所占比例。TEC为该地区的技术市场合同交易金额,用来说明地区的技术创新。NUM为该地区企业数量,用以说明区域产业规模。FDI为外商直接投资,用以说明外资对产业集聚的影响。SPHWY是该地区在总公路里程数的份额。IM指本地市场效应,用以反映的就是本地市场规模的大小,各地区人均GDP与全国人均GDP的比值来衡量。某地区该比值越大那就意味着某地区越接近本地市场。TER第三产业所占比例,用以描述产业集聚的配套设施。LINK指产业关联系数,新经济地理理论认为,投入产出会影响产业的区位集中。但投入产出数据缺乏,采用王业强、魏后凯(2007)的方法,用工业产值中制造业产值所占比例来估算产业关联效应。所用的数据都出自于2006年、2007年《中国统计年鉴》、《江苏统计年鉴》、《中国工业统计年鉴》。三、结果分析运用SPSS统计软件版对数据进行回归分析,结果见下表。EDU,TEC,NUM,SPHWY未通过显著性检验,应从模型中删去,其余变量如下页表。从以上的数据可以看出,模型修正后,可以从需求条件、产业特征、外部环境等几个方面对产业集聚效应影响因素进行了说明。市场容量有利于产业集聚的形成,根据波特的理论,产业集聚与市场需求有很大的联系。而第三产业的配套设施的显著影响为负,这是一个与常理相违背的地方,笔者对此的解释是目前沿江地区的第三产业发展水平严重落后于制造业的发展,还未能体现对产业集聚形成有利的促进效应。产业关联,产业集聚之所以形成,是由于上下游产业的聚集形成的。而产业集聚对区域经济的影响也在于通过产业链影响其他产业。产业关联越是紧密,越是广泛,越是有可能通过聚集效应和乘数效应的作用带动整个区域经济的发展。FDI对江苏沿江制造业产业集聚的发展有着较为显著的推动作用,从实际情况来看,江苏的产业集聚的形成,尤其是苏南的集聚现象很多都是由外资带动的。预期的产业规模没有对产业集聚形成有显著影响,并不代表没有影响,而说明沿江制造业产业集聚并没有以简单的数量的累积,可以解释为重在质量的集约式发展。四、结论和政策含义本文通过对江苏沿江制造业产业集聚的统计描述,并对制造业产业集聚的决定因素建立了一个基于地理经济学分析的理论框架,最终得出一些启示性结论:江苏沿江制造业产业集聚的形成主要由产业关联、市场规模和外商投资等因素推动,地理因素、人口因素、规模经济等特征的作用效果不明显。根据本文的结论,针对目前江苏沿江制造业产业集聚的现状及存在的问题,可以认为,随着我国市场化改革的不断推进,制造业集聚趋势也在不断加强,江苏沿江的制造业产业集聚也会不断加强。这种加强体现在资源的优化配置,区域经济的高速发展,核心竞争力的不断提高。对于沿江制造业的发展有以下启示:一、重视服务支持对产业集聚效应的巨大促进作用,加快相关配套设施的建设,不断完善配套服务;二、适当扩大产业规模,促进龙头企业和大量中小企业共同发展,形成以小促大,以大助小共同发展的局面;三、外部环境方面继续推进国有企业、三资企业的共同发展,寻求投资主体的多元化,积极吸引外资;四、提高区域企业创新能力,鼓励专利发明和企业间的技术溢出。参考文献:[1]段小梅.台湾制造业投资大陆的产业集群分析[J].台湾研究集刊,2007,(2):40-49.[2]迈克尔·波特.竞争战略[M].北京:华夏出版社,2002.[3]徐康宁,陈奇.外商直接投资在产业集群形成中的作用[J].现代经济探讨,2003,(12):3-7.[4]杨树旺,易明.彭响产业集群的因素分析[J].西安财经学院学报,2006,(6):49-53.[5]王业强,魏后凯.产业特征、空间竞争与制造业地理集中[J].管理世界,2007,(4):68-77.[6]魏守华.集群竞争力的动力机制及其实证分析[J].中国工业经济,2002,(10).[7]文玫.中国工业在区域上的重新定位和聚集[J].经济研究,2004,(2):84-94.参考下吧
在统计学中,统计模型是指当有些过程无法用理论分析 方法 导出其模型,但可通过试验或直接由工业过程测定数据,经过数理统计法求得各变量之间的函数关系。下文是我为大家整理的关于统计模型论文的 范文 ,欢迎大家阅读参考!
统计套利模型的理论综述与应用分析
【摘要】统计套利模型是基于数量经济学和统计学建立起来的,在对历史数据分析的基础之上,估计相关变量的概率分布,并结合基本面数据对未来收益进行预测,发现套利机会进行交易。统计套利这种分析时间序列的统计学特性,使其具有很大的理论意义和实践意义。在实践方面广泛应用于个对冲基金获取收益,理论方面主要表现在资本有效性检验以及开放式基金评级,本文就统计套利的基本原理、交易策略、应用方向进行介绍。
【关键词】统计套利 成对交易 应用分析
一、统计套利模型的原理简介
统计套利模型是基于两个或两个以上具有较高相关性的股票或者其他证券,通过一定的方法验证股价波动在一段时间内保持这种良好的相关性,那么一旦两者之间出现了背离的走势,而且这种价格的背离在未来预计会得到纠正,从而可以产生套利机会。在统计套利实践中,当两者之间出现背离,那么可以买进表现价格被低估的、卖出价格高估的股票,在未来两者之间的价格背离得到纠正时,进行相反的平仓操作。统计套利原理得以实现的前提是均值回复,即存在均值区间(在实践中一般表现为资产价格的时间序列是平稳的,且其序列图波动在一定的范围之内),价格的背离是短期的,随着实践的推移,资产价格将会回复到它的均值区间。如果时间序列是平稳的,则可以构造统计套利交易的信号发现机制,该信号机制将会显示是否资产价格已经偏离了长期均值从而存在套利的机会 在某种意义上存在着共同点的两个证券(比如同行业的股票), 其市场价格之间存在着良好的相关性,价格往往表现为同向变化,从而价格的差值或价格的比值往往围绕着某一固定值进行波动。
二、统计套利模型交易策略与数据的处理
统计套利具 体操 作策略有很多,一般来说主要有成对/一篮子交易,多因素模型等,目前应用比较广泛的策略主要是成对交易策略。成对策略,通常也叫利差交易,即通过对同一行业的或者股价具有长期稳定均衡关系的股票的一个多头头寸和一个空头头寸进行匹配,使交易者维持对市场的中性头寸。这种策略比较适合主动管理的基金。
成对交易策略的实施主要有两个步骤:一是对股票对的选取。海通证券分析师周健在绝对收益策略研究―统计套利一文中指出,应当结合基本面与行业进行选股,这样才能保证策略收益,有效降低风险。比如银行,房地产,煤电行业等。理论上可以通过统计学中的聚类分析方法进行分类,然后在进行协整检验,这样的成功的几率会大一些。第二是对股票价格序列自身及相互之间的相关性进行检验。目前常用的就是协整理论以及随机游走模型。
运用协整理论判定股票价格序列存在的相关性,需要首先对股票价格序列进行平稳性检验,常用的检验方法是图示法和单位根检验法,图示法即对所选各个时间序列变量及一阶差分作时序图,从图中观察变量的时序图出现一定的趋势册可能是非平稳性序列,而经过一阶差分后的时序图表现出随机性,则序列可能是平稳的。但是图示法判断序列是否存在具有很大的主观性。理论上检验序列平稳性及阶输通过单位根检验来确定,单位根检验的方法很多,一般有DF,ADF检验和Phillips的非参数检验(PP检验)一般用的较多的方法是ADF检验。
检验后如果序列本身或者一阶差分后是平稳的,我们就可以对不同的股票序列进行协整检验,协整检验的方法主要有EG两步法,即首先对需要检验的变量进行普通的线性回归,得到一阶残差,再对残差序列进行单位根检验,如果存在单位根,那么变量是不具有协整关系的,如果不存在单位根,则序列是平稳的。EG检验比较适合两个序列之间的协整检验。除EG检验法之外,还有Johansen检验,Gregory hansan法,自回归滞后模型法等。其中johansen检验比较适合三个以上序列之间协整关系的检验。通过协整检验,可以判定股票价格序列之间的相关性,从而进行成对交易。
Christian L. Dunis和Gianluigi Giorgioni(2010)用高频数据代替日交易数据进行套利,并同时比较了具有协整关系的股票对和没有协整关系股票对进行套利的立即收益率,结果显示,股票间价格协整关系越高,进行统计套利的机会越多,潜在收益率也越高。
根据随机游走模型我们可以检验股票价格波动是否具有“记忆性”,也就是说是否存在可预测的成分。一般可以分为两种情况:短期可预测性分析及长期可预测性分析。在短期可预测性分析中,检验标准主要针对的是随机游走过程的第三种情况,即不相关增量的研究,可以采用的检验工具是自相关检验和方差比检验。在序列自相关检验中,常用到的统计量是自相关系数和鲍克斯-皮尔斯 Q统计量,当这两个统计量在一定的置信度下,显著大于其临界水平时,说明该序列自相关,也就是存在一定的可预测性。方差比检验遵循的事实是:随机游走的股价对数收益的方差随着时期线性增长,这些期间内增量是可以度量的。这样,在k期内计算的收益方差应该近似等于k倍的单期收益的方差,如果股价的波动是随机游走的,则方差比接近于1;当存在正的自相关时,方差比大于1;当存在负的自相关是,方差比小于1。进行长期可预测性分析,由于时间跨度较大的时候,采用方差比进行检验的作用不是很明显,所以可以采用R/S分析,用Hurst指数度量其长期可预测性,Hurst指数是通过下列方程的回归系数估计得到的:
Ln[(R/S)N]=C+H*LnN
R/S 是重标极差,N为观察次数,H为Hurst指数,C为常数。当H>时说,说明这些股票可能具有长期记忆性,但是还不能判定这个序列是随机游走或者是具有持续性的分形时间序列,还需要对其进行显著性检验。
无论是采用协整检验还是通过随机游走判断,其目的都是要找到一种短期或者长期内的一种均衡关系,这样我们的统计套利策略才能够得到有效的实施。
进行统计套利的数据一般是采用交易日收盘价数据,但是最近研究发现,采用高频数据(如5分钟,10分钟,15分钟,20分钟收盘价交易数据)市场中存在更多的统计套利机会。日交易数据我们选择前复权收盘价,而且如果两只股票价格价差比较大,需要先进性对数化处理。Christian L. Dunis和Gianluigi Giorgioni(2010)分别使用15分钟收盘价,20分钟收盘价,30分以及一个小时收盘价为样本进行统计套利分析,结果显示,使用高频数据进行统计套利所取得收益更高。而且海通证券金融分析师在绝对收益策略系列研究中,用沪深300指数为样本作为统计套利 配对 交易的标的股票池,使用高频数据计算累计收益率比使用日交易数据高将近5个百分点。
三、统计套利模型的应用的拓展―检验资本市场的有效性
Fama(1969)提出的有效市场假说,其经济含义是:市场能够对信息作出迅速合理的反应,使得市场价格能够充分反映所有可以获得的信息,从而使资产的价格不可用当前的信息进行预测,以至于任何人都无法持续地获得超额利润.通过检验统计套利机会存在与否就可以验证资本市场是有效的的,弱有效的,或者是无效的市场。徐玉莲(2005)通过运用统计套利对中国资本市场效率进行实证研究,首先得出结论:统计套利机会的存在与资本市场效率是不相容的。以此为理论依据,对中国股票市场中的价格惯性、价格反转及价值反转投资策略是否存在统计套利机会进行检验,结果发现我国股票市场尚未达到弱有效性。吴振翔,陈敏(2007)曾经利用这种方法对我国A股市场的弱有效性加以检验,采用惯性和反转两种投资策略发现我国A股若有效性不成立。另外我国学者吴振翔,魏先华等通过对Hogan的统计套利模型进行修正,提出了基于统计套利模型对开放式基金评级的方法。
四、结论
统计套利模型的应用目前主要表现在两个方面:1.作为一种有效的交易策略,进行套利。2.通过检测统计套利机会的存在,验证资本市场或者某个市场的有效性。由于统计套利策略的实施有赖于做空机制的建立,随着我股指期货和融资融券业务的推出和完善,相信在我国会有比较广泛的应用与发展。
参考文献
[1] . Burgess:A computational Methodolology for Modelling the Dynamics of statistical arbitrage, London business school,PhD Thesis,1999.
[2]方昊.统计套利的理论模式及应用分析―基于中国封闭式基金市场的检验.统计与决策,2005,6月(下).
[3]马理,卢烨婷.沪深 300 股指期货期现套利的可行性研究―基于统计套利模型的实证.财贸研究,2011,1.
[4]吴桥林.基于沪深 300 股指期货的套利策略研究[D].中国优秀硕士学位论文.2009.
[5]吴振翔,陈敏.中国股票市场弱有效性的统计套利检验[J].系统工程理论与实践.2007,2月.
关于半参统计模型的估计研究
【摘要】随着数据模型技术的迅速发展,现有的数据模型已经无法满足实践中遇到的一些测量问题,严重的限制了现代科学技术在数据模型上应用和发展,所以基于这种背景之下,学者们针对数据模型测量实验提出了新的理论和方法,并研制出了半参数模型数据应用。半参数模型数据是基于参数模型和非参数模型之上的一种新的测量数据模型,因此它具备参数模型和非参数模型很多共同点。本文将结合数据模型技术,对半参统计模型进行详细的探究与讨论。
【关键词】半参数模型 完善误差 测量值 纵向数据
本文以半参数模型为例,对参数、非参数分量的估计值和观测值等内容进行讨论,并运用三次样条函数插值法得出非参数分量的推估表达式。另外,为了解决纵向数据下半参数模型的参数部分和非参数部分的估计问题,在误差为鞅差序列情形下,对半参数数据模型、渐近正态性、强相合性进行研究和分析。另外,本文初步讨论了平衡参数的选取问题,并充分说明了泛最小二乘估计方法以及相关结论,同时对半参数模型的迭代法进行了相关讨论和研究。
一、概论
在日常生活当中,人们所采用的参数数据模型构造相对简单,所以操作起来比较容易;但在测量数据的实际使用过程中存在着相关大的误差,例如在测量相对微小的物体,或者是对动态物体进行测量时。而建立半参数数据模型可以很好的解决和缓解这一问题:它不但能够消除或是降低测量中出现的误差,同时也不会将无法实现参数化的系统误差进行勾和。系统误差非常影响观测值的各种信息,如果能改善,就能使其实现更快、更及时、更准确的误差识别和提取过程;这样不仅可以提高参数估计的精确度,也对相关科学研究进行了有效补充。
举例来说,在模拟算例及坐标变换GPS定位重力测量等实际应用方面,体现了这种模型具有一定成功性及实用性;这主要是因为半参数数据模型同当前所使用的数据模型存在着一致性,可以很好的满足现在的实际需要。而新建立的半参数模型以及它的参数部分和非参数部分的估计,也可以解决一些污染数据的估计问题。这种半参数模型,不仅研究了纵向数据下其自身的t型估计,同时对一些含光滑项的半参数数据模型进行了详细的阐述。另外,基于对称和不对称这两种情况,可以在一个线性约束条件下对参数估计以及假设进行检验,这主要是因为对观测值产生影响的因素除了包含这个线性关系以外,还受到某种特定因素的干扰,所以不能将其归入误差行列。另外,基于自变量测量存在一定误差,经常会导致在计算过程汇总,丢失很多重要信息。
二、半参数回归模型及其估计方法
这种模型是由西方著名学者Stone在上世纪70年代所提出的,在80年代逐渐发展并成熟起来。目前,这种参数模型已经在医学以及生物学还有经济学等诸多领域中广泛使用开来。
半参数回归模型介于非参数回归模型和参数回归模型之间,其内容不仅囊括了线性部分,同时包含一些非参数部分,应该说这种模型成功的将两者的优点结合在一起。这种模型所涉及到的参数部分,主要是函数关系,也就是我们常说的对变量所呈现出来的大势走向进行有效把握和解释;而非参数部分则主要是值函数关系中不明确的那一部分,换句话就是对变量进行局部调整。因此,该模型能够很好的利用数据中所呈现出来的信息,这一点是参数回归模型还有非参数归回模型所无法比拟的优势,所以说半参数模型往往拥有更强、更准确的解释能力。
从其用途上来说,这种回归模型是当前经常使用的一种统计模型。其形式为:
三、纵向数据、线性函数和光滑性函数的作用
纵向数据其优点就是可以提供许多条件,从而引起人们的高度重视。当前纵向数据例子也非常多。但从其本质上讲,纵向数据其实是指对同一个个体,在不同时间以及不同地点之上,在重复观察之下所得到一种序列数据。但由于个体间都存在着一定的差别,从而导致在对纵向数据进行求方差时会出现一定偏差。在对纵向数据进行观察时,其观察值是相对独立的,因此其特点就是可以能够将截然不同两种数据和时间序列有效的结合在一起。即可以分析出来在个体上随着时间变化而发生的趋势,同时又能看出总体的变化形势。在当前很多纵向数据的研究中,不仅保留了其优点,并在此基础之上进行发展,实现了纵向数据中的局部线性拟合。这主要是人们希望可以建立输出变量和协变量以及时间效应的关系。可由于时间效应相对比较复杂,所以很难进行参数化的建模。
另外,虽然线性模型的估计已经取得大量的成果,但半参数模型估计至今为止还是空白页。线性模型的估计不仅仅是为了解决秩亏或病态的问题,还能在百病态的矩阵时,提供了处理线性、非线性及半参数模型等方法。首先,对观测条件较为接近的两个观测数据作为对照,可以削弱非参数的影响。从而将半参数模型变成线性模型,然后,按线性模型处理,得到参数的估计。而多数的情况下其线性系数将随着另一个变量而变化,但是这种线性系数随着时间的变化而变化,根本求不出在同一个模型中,所有时间段上的样本,亦很难使用一个或几个实函数来进行相关描述。在对测量数据处理时,如果将它看作为随机变量,往往只能达到估计的作用,要想在经典的线性模型中引入另一个变量的非线性函数,即模型中含有本质的非线性部分,就必须使用半参数线性模型。
另外就是指由各个部分组成的形态,研究对象是非线性系统中产生的不光滑和不可微的几何形体,对应的定量参数是维数,分形上统计模型的研究是当前国际非线性研究的重大前沿课题之一。因此,第一种途径是将非参数分量参数化的估计方法,也称之为参数化估计法,是关于半参数模型的早期工作,就是对函数空间附施加一定的限制,主要指光滑性。一些研究者认为半参数模型中的非参数分量也是非线性的,而且在大多数情形下所表现出来的往往是不光滑和不可微的。所以同样的数据,同样的检验方法,也可以使用立方光滑样条函数来研究半参数模型。
四、线性模型的泛最小二乘法与最小二乘法的抗差
(一)最小二乘法出现于18世纪末期
在当时科学研究中常常提出这样的问题:怎样从多个未知参数观测值集合中求出参数的最佳估值。尽管当时对于整体误差的范数,泛最小二乘法不如最小二乘法,但是当时使用最多的还是最小二乘法,其目的也就是为了估计参数。最小二乘法,在经过一段时间的研究和应用之后,逐步发展成为一整套比较完善的理论体系。现阶段不仅可以清楚地知道数据所服从的模型,同时在纵向数据半参数建模中,辅助以迭代加权法。这对补偿最小二乘法对非参数分量估计是非常有效,而且只要观测值很精确,那么该法对非参数分量估计更为可靠。例如在物理大地测量时,很早就使用用最小二乘配置法,并得到重力异常最佳估计值。不过在使用补偿最小二乘法来研究重力异常时,我们还应在兼顾着整体误差比较小的同时,考虑参数估计量的真实性。并在比较了迭代加权偏样条的基础上,研究最小二乘法在当前使用过程中存在的一些不足。应该说,该方法只强调了整体误差要实现最小,而忽略了对参数分量估计时出现的误差。所以在实际操作过程中,需要特别注意。
(二)半参模型在GPS定位中的应用和差分
半参模型在GPS相位观测中,其系统误差是影响高精度定位的主要因素,由于在解算之前模型存在一定误差,所以需及时观测误差中的粗差。GPS使用中,通过广播卫星来计算目标点在实际地理坐标系中具体坐标。这样就可以在操作过程中,发现并恢复整周未知数,由于观测值在卫星和观测站之间,是通过求双差来削弱或者是减少对卫星和接收机等系统误差的影响,因此难于用参数表达。但是在平差计算中,差分法虽然可以将观测方程的数目明显减少,但由于种种原因,依然无法取得令人满意的结果。但是如果选择使用半参数模型中的参数来表达系统误差,则能得到较好的效果。这主要是因为半参数模型是一种广义的线性回归模型,对于有着光滑项的半参数模型,在既定附加的条件之下,能够提供一个线性函数的估计方法,从而将测值中的粗差消除掉。
另外这种方法除了在GPS测量中使用之外,还可应用于光波测距仪以及变形监测等一些参数模型当中。在重力测量中的应用在很多情形下,尤其是数学界的理论研究,我们总是假定S是随机变量实际上,这种假设是合理的,近几年,我们对这种线性模型的研究取得了一些不错的成果,而且因其形式相对简洁,又有较高适用性,所以这种模型在诸多领域中发挥着重要作用。
通过模拟的算例及坐标变换GPS定位重力测量等实际应用,说明了该法的成功性及实用性,从理论上说明了流行的自然样条估计方法,其实质是补偿最小二乘方法的特例,在今后将会有广阔的发展空间。另外 文章 中提到的分形理论的研究对象应是非线性系统中产生的不光滑和不可微的几何形体,而且分形已经在断裂力学、地震学等中有着广泛的应用,因此应被推广使用到研究半参数模型中来,不仅能够更及时,更加准确的进行误差的识别和提取,同时可以提高参数估计的精确度,是对当前半参数模型研究的有力补充。
五、 总结
文章所讲的半参数模型包括了参数、非参数分量的估计值和观测值等内容,并且用了三次样条函数插值法得到了非参数分量的推估表达式。另外,为了解决纵向数据前提下,半参数模型的参数部分和非参数部分的估计问题,在误差为鞅差序列情形下,对半参数数据模型、渐近正态性、强相合性进行研究和分析。同时介绍了最小二乘估计法。另外初步讨论了平衡参数的选取问题,还充分说明了泛最小二乘估计方法以及有关结论。在对半参数模型的迭代法进行了相关讨论和研究的基础之上,为迭代法提供了详细的理论说明,为实际应用提供了理论依据。
参考文献
[1]胡宏昌.误差为AR(1)情形的半参数回归模型拟极大似然估计的存在性[J].湖北师范学院学报(自然科学版),2009(03).
[2]钱伟民,李静茹.纵向污染数据半参数回归模型中的强相合估计[J].同济大学学报(自然科学版),2009(08).
[3]樊明智,王芬玲,郭辉.纵向数据半参数回归模型的最小二乘局部线性估计[J].数理统计与管理,2009(02).
[4]崔恒建,王强.变系数结构关系EV模型的参数估计[J].北京师范大学学报(自然科学版).2005(06).
[5]钱伟民,柴根象.纵向数据混合效应模型的统计分析[J].数学年刊A辑(中文版).2009(04)
[6]孙孝前,尤进红.纵向数据半参数建模中的迭代加权偏样条最小二乘估计[J].中国科学(A辑:数学),2009(05).
[7]张三国,陈希孺.EV多项式模型的估计[J].中国科学(A辑),2009(10).
[8]任哲,陈明华.污染数据回归分析中参数的最小一乘估计[J].应用概率统计,2009(03).
[9]张三国,陈希孺.有重复观测时EV模型修正极大似然估计的相合性[J].中国科学(A辑).2009(06).
[10]崔恒建,李勇,秦怀振.非线性半参数EV四归模型的估计理论[J].科学通报,2009(23).
[11]罗中明.响应变量随机缺失下变系数模型的统计推断[D].中南大学,2011.
[12]刘超男.两参数指数威布尔分布的参数Bayes估计及可靠性分析[D].中南大学,2008.
[13]郭艳.湖南省税收收入预测模型及其实证检验与经济分析[D].中南大学,2009.
[14]桑红芳.几类分布的参数估计的损失函数和风险函数的Bayes推断[D].中南大学,2009.
[15]朱琳.服从几类可靠性分布的无失效数据的bayes分析[D].中南大学,2009.
[16]黄芙蓉.指数族非线性模型和具有AR(1)误差线性模型的统计分析[D].南京理工大学,2009.
猜你喜欢:
1. 统计学分析论文
2. 统计方面论文优秀范文参考
3. 统计优秀论文范文
4. 统计学的论文参考范例
这个还是需要一些相关资料吧不然不好做的
117 浏览 5 回答
165 浏览 4 回答
191 浏览 2 回答
105 浏览 3 回答
85 浏览 3 回答
117 浏览 2 回答
178 浏览 2 回答
356 浏览 2 回答
202 浏览 5 回答
92 浏览 4 回答
187 浏览 3 回答
283 浏览 4 回答
194 浏览 3 回答
140 浏览 6 回答
235 浏览 3 回答