体育统计学是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科。下文是我为大家整理的关于体育统计学论文的范文,欢迎大家阅读参考!
对《体育统计学》教学的思考
摘 要 《体育统计学》属于基础应用学科,在很多体育院校中开设,此课程的学习有助于提高学生用科学方法研究、解释体育领域中各种问题的能力。但很多学生对《体育统计学》学习目的不明确,学习方法不熟悉,甚至对此课程的开设必要性存在一定偏见。体育运动的发展、创新离不开《体育统计学》的理论支撑,所以有必要对其教学方法、方式进行研究。本文通过调查发现了学习中存在的问题,并提出了相对应的学习建议。
关键词 体育统计学 教学
一、引言
体育统计是运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科。随着体育科学的发展,体育领域中许多问题都需要运用统计学原理、方法来解决。体育系的大学生学习《体育统计学》有助于提高他们科学地研究或解释体育领域中的各种问题。但大学生参加科研活动的机会较少,运用统计知识的实践机会也很少,造成他们对《体育统计学》的学习目的不明确,且存在一定的偏见。所以,有必要对《体育统计学》的教学方法、方式进行思考与研究,以提高体育系大学生学习《体育统计学》的积极性。
二、研究方法
(一)研究对象
山西体育职业学院09级的全体学生,共6个班级,237人。
(二)研究方法
运用简单随机抽样法中的随机数表法随机在每个班抽取10名学生,共60名学生进行座谈,并做好访谈记录。访谈内容包括对体育统计学的学习目的及意义、学习方法、学习中存在的问题及对教学的建议等。
三、大学生学习《体育统计学》的现状及存在的问题
(一)大学生对《体育统计学》课程开设的误解
经访谈发现山西体育职业学院没有学生认为开设《体育统计学》课程非常必要,仅18%的学生认为开设此课程很有必要,82%的学生认为该课程的开设是没有必要的,认为上体育统计学课就像是在上数学课,学习计算一些统计指标,计算步骤及过程,觉得在今后的学习、工作中运用不到。
(二)大学生在学习《体育统计学》过程中存在的问题
虽然在教学过程中一直强调《体育统计学》是应用性学科,属方法论范畴,重点是掌握方法,但经过与学生访谈后,发现学生在这门课程学习中存在的主要问题是:偏重教科书中列举的各个指标的计算过程和统计推断的计算步骤,也仅限学习书中的例题,不会灵活运用到其他类同的实际教学、训练及科研问题中。学体育的学生数学基础比较薄弱,导致学习兴趣低落。
(三)大学生对《体育统计学》教材的看法
《体育统计学》课程在体育院校开设已有二十几年,体育统计教材多达几十本,但适合于教学的却较少。经访谈后,学生认为教材中的例题比较空,且与实际相差较远;还认为教材中统计理论知识较多,介绍的多是统计方法的推导、计算与步骤,太抽象,不是很符合体育院校学生掌握知识的特点。
四、对大学生学习《体育统计学》的建议
(一)摆正学习态度,明确学习目的
学生不管学什么课程首先要摆正学习态度、明确学习目的,学校开设《体育统计学》课程的目的是为了使学生能够领会体育统计的基本思想、概念、基本思路,并能把体育领域中存在的实际问题,运用科学合理的统计思想及方法进行定量解决,并为将来毕业论文设计或从事体育科研工作打下坚实的基础。
(二)熟悉常见的基本概念及其统计学意义
体育统计中常见的基本概念有正态分布、平均数、方差、标准差、标准误、误差、相关系数等,学生在学习过程中应该重点掌握这些基本概念及统计指标的统计学意义,而不是去弄清每一个指标的计算步骤,计算过程能看明白即可不需要记忆。
(三)掌握假设检验的基本思想
假设检验的基本思想:统计假设有两个类型H0和HA。在具体的研究工作中,样本统计量之间或样本统计量与总体参数之间一般是存在偏差的,这种偏差存在的原因有两种:抽样误差和非抽样误差。
(四)熟知常用假设检验方法的适用条件
体育统计学中常见的假设检验方法有t检验、方差分析、卡方检验、正态性检验、相关分析、回归分析等,不同的检验方法适用的条件是不同的,在进行数据统计的过程中必须严格按照适用条件选择正确的统计推断方法。
(五)熟练掌握SPSS软件处理数据的过程
1.在SPSS软件中的数据输入与编辑
SPSS软件是以数据为操作对象,按统计方法要求整理数据格式,是使用SPSS进行统计分析前首先要进行的工作。数据的输入格式要严格按照相对应的统计方法要求进行编辑,不同的统计方法数据的录入格式不同,如果数据录入错误,就不能进行统计分析,甚至统计出错误的结果。
2.在SPSS软件中的统计方法选择及处理步骤
在SPSS软件中提供了很多统计方法,大部分的统计方法在数据编辑窗“Analyze”的下拉菜单中。在保证数据录入正确的前提下,根据自己研究需要选择合适的统计方法,在打开的窗口中导入相对应变量,并在复选框中选择想要的统计指标,再点击 “ok”,即可得到统计分析结果。
3.正确解释SPSS软件处理数据的结果
对于统计结果的分析,首先要按照假设检验思想进行分析,用小概率水平来控制,其次要联系实际问题进行分析,从统计结果去估计发生某种体育事件的原因,进而来反映实验或调查的科学性、实践性、合理性,并根据研究结果的实用性投入实践。
参考文献:
[1] 孙芝娟.正确选用体育统计方法的若干思考[J].体育成人教育学刊.(2):49-50.
[2] 陈红梅.SPSS在体育统计实践教学中的应用[J].体育百科,2005(2):54.
[3] 李健.从体育统计误用透视高校体育统计教育[J].体育科技.(1):79-81.
《体育统计学》课程改革学生需求的调查研究
摘 要: 对体育统计课程改革学生的需求进行了调查,运用SPSS、Excel等软件对调查数据 进行了统计分析,挖掘了当前学生在《体育统计学》课程目标、教材、教法、评价等方面的 需要,并根据需要提出了该课程改革的建议,对《体育统计学》课程改革和改善教学质量具 有重要的参考意义。
关键词:体育统计学;课程改革;学生需求
随着体育事业的迅猛发展,群众体育、竞技体育及学校体育等的研究正逐步趋向于定量化、 科学化,这就要求每一位体育工作者必须掌握定量化、科学化的研究方法。作为体育院系各 专业的基础必修课《体育统计学》课程肩负着该项重任之一,因此,改革体育统计课程体系 、结构、内容就历史地被提到议事日程上来了。总结起来,以往的对体育统计课程教学的研 究主要集中在两方面,一方面是对教学形式与手段提出了进行多媒体教学实验改革[1~4];另一方面是对体育统计课程进行计算机辅助教学改革[5~9],其中有的 提出了运用EXCEL软件辅助,有的提出了利用SPSS软件辅助,到底怎么改才是社会和学生所 接受的?根据课程改革的三维理论[10],课程改革必须顺应时代的发展、学科的发 展和学生 的发展需要。本研究就体育统计学课程改革学生的需要进行了调查研究,力求将目前该学科 学生的需求客观、全面、准确地反映出来,为体育统计课程的改革提供实证性的参考建议。
1 研究对象与方法
研究对象 高校体育院系学生中学过《体育统计学》课 程的学生262人。
研究方法
问卷调查法 根据.泰勒的课程理论[11]课程 问题应包含教材内容、课程目标、教 学要求、评价方案等四个维度,问卷按以上四个维度来设计,共15题。发放问卷300张,回 收率为,有效率为100%。利用SPSS对问卷量表进行信度与效度的检验,Cronbach-α系 数为,各维度信度在~之间,KMO为,主因子总变异为,因子载荷为0. 73,说明问卷量表信度较高,效度好。
数理统计方法 问卷数据用统计软件与Excel进行 分析处理。
2 结果与分析
课程目标我们查阅了相关学校的《体育统计学》教学大纲[12~14],将体育统计课程目标归 纳为 6个分维度:1) 培养学生的统计思想;2) 培养学生的计算机统计能力;3) 培养学生的统计 知识与方法;4) 培养学生的分析和推断能力;5) 培养学生掌握资料收集的方法;6) 培养 学生的科学研究能力。学生按认同的重要程度打分,最重要的为10分,最次要的为1分。学 生对这六个分维度的认同情况如表1所示。
从表1可以看出,“培养学生的计算机统计能力”平均分最高为分,这说明从一个侧面 反映了学生要求用现代的计算工具处理数值运算的愿望;“培养学生的研究能力”平均分最 低为分,说明在所有目标中,他们对这方面的能力培养要求放在其次,且标准差最大, 说明学生对其看法分歧较大;其中占百分比最高、分值也相对较高(8分)的是“培养学生 资料收集的能力”为,说明大部分学生渴求对统计资料收集方法的学习;从表1还可以 发现,选择6、7、8、9分值的人数相对较多,说明学生对各培养目标认同度都很高。
教材方面学生对《体育统计学》教材[15]重点章节的认同率见表2,“资料的收集和整理” 认同率为3 ;推断统计在首选中占 ,次选占;样本特征数认同率为;说明这 三个章节是体育统计学的最基本的内容,也是体育工作者在实践中应用最多的内容,特别是 “资料的收集与整理”,是学生最常用的统计方法。
教材难度:对于现在所学的高等教育出版社出版的《体育统计学》教材,学生反映见图1:“ 难”的占,“一般”的占,“容易”的占,说明我们目前采用的教材难度 适中。在计算机辅助统计运算见图2:认为 “必要”采用计算机辅助统计运算的有 157人, 占总数的,没必要的有 18人,占总数的,说明绝大多数学生认同计算机辅助体育 统计教学。在采用何种辅助方面见图3:选择“计算机语言辅助”的有 93人,占总数的 ,选择“具有统计功能的计算机软件”的有142人,占总数的;软件辅助选择情况见图 4,认为该用“Excel” 的有138人,占总数的,选用“SPSS软件”的有92人,占总数 的,说明学习者选择Excel软件辅助较SPSS软件辅助的多,用Excel软件辅助体育统计 运算的内容是最受学生欢迎的。
教学方面开课时间见图5:选择在“实习前”的有103人,占总数的;选“大一”的有57人,占总 数的,说明学生对该学科的作用有强烈的用于实践的愿望,希望在实习之前和学习精 力、时间都充沛的大二开设,其原因是学生希望在实习中应用和收集素材,为以后的教学训练和毕业论文的研究打下基础;教学方法见 图6:选择“多媒体理论和事例教学相结合”方式的有73人,占总数的;选择“理论与 计算机实验结合”的有165人,占总数的,说明学生喜欢采用“理论与计算机实验结合 ”的教学方法上课的形式,愿意自己动手掌握计算机统计操作技术,希望能够亲自参与实践 研究,体验研究过程与方法,纯理论的教学是学生最不喜欢的教学方式。课时数见图7:有3 的人选择“54学时”;有的人选择“36学时”;有的人选择“18学时”;有 选择“72学时”。实验教学见图8:有139人占总数的选择有“必要”采用实验教 学来培养学生利用计算机统计分析数值的能力。
评价评价方式见图9:选择过程性评价的有98人,占总数的;选择终结性评价有39人,占 总数的;选择两者的结合的有117人,占总数的,说明学生喜欢多元化的考核方 式和评价方式的结合;考核方式见图10:选择“课程论文”形式的有88人,占总数的 %;选择“开卷考试”的有53人,占总数的;选择“闭卷考试”的有25人,占总数的9. 2%;选择“平时成绩”的有50人,占总数的;选择“均有”的有22人,占总数的 ;说明学生愿意接受多种考核形式,很认同“课程论文”的形式,较受欢迎的考查方式是“ 开卷考试”与平时成绩。
3 讨 论
本研究发现学生强烈地要求通过体育统计课程的学习能使他们的“计算机统计能力”、“收 集资料的能力”、“分析和推断能力”、“科学研究能力”等方面有所提高。
根据统计学定 义“把研究数据的搜集、整理与分析方法的学问叫统计学”[16],因此在课程体系 上应该遵 循“研究设计→描述性统计→推断统计→统计报告”才是体育统计课程完整的体系,这样的 体系才能满足学习者的需求,才能达到他们的愿望和目的。“研究数据收集”的学问由“研 究设计”模块完成,它包括“根据研究的目的怎样明确统计总体、研究的内容与指标、研究 的形式与方法、样本数量的选择与确定、收集数据的方法” 等;“统计报告”是将收集和 统计分析的数据用统计学的方式表达出来,是学生学习体育统计课程获得的知识和能力的综 合体现,是我们《体育统计学》课程教育的最终目标。
而现在的体育统计学课程内容主要是 “描述性统计→推断统计”,强调“数据的整理与统计分析方法的原理”,对数据的整理与 统计分析方法可操作性的能力培养不够;对怎样在实际问题中对“数据的搜集”学生学习的 知识和方法不够;对统计分析的数据处理结果怎样来表达培养不够。因此导致体育统计与实 践问题脱节,使学生在学习过程中无法体验到运用体育统计知识解决问题的操作性过程,更 无法证明体育统计课程在体育教育与训练中的价值,而往往是在他们读研或在以后的工作中 才发现体育统计课程原来那么有用,为什么会造成这样的局面?本人认为这与现在的体 育统计学课程体系缺失不无关系。这与其他学者的研究“体育统计学作为一门新兴学科,仍 未形 成严密的科学体系,特别是在应用体系方面更加欠缺”[17]一致。所以完善体育统 计学课程体系,培养学生将来适应时代发展需要的能力,是体育统计课程的最终培养目标。
教材是教学内容的有形载体,是实施教学活动的依据,也是落实课程计划和实现课程目标的 重要工具,同时也是学生学习的重要工具[18]。学生希望教材中增加计算机软件辅 助运算的 部分,特别是Excel软件的应用;由于Excel是Office的套件之一,任何个人和单位电脑上都 有安装,在课外也容易使用,非常普及,这些方法在以后的工作中可以学以致用;
另一方面 它是全中文版,较其它统计软件易学、易用、易得、易懂;所以学生喜欢Excel为统计工具 来辅助统计课程的学习,希望自己学习的知识能和社会实践联系起来。因此教材改革要顺应 时代变化,符合学生实际,在内容上以实用、够用为原则,选择学生需求的统计知识和统计 技能;在教材内容的表达形式上要符合体育学学生的学习特点,选择操作性强、联系学生的 生活、训练的学习内容,用生动活泼的形式表达出来,才是乐于他们接受的。
另外,学生喜 欢上机操作,希望通过上机亲自动手解决一些实际问题;其次学生喜欢以计算机为主体的多 媒体与事例组合教学模式,因此开设体育统计实验课是时代发展的需要,同时也是学生发展 的需要;因此体育统计教学需要将原来的纯理论教学模式向体育实际运用、实验型转变;在 教学方面需要改变重理论轻实践、重知识轻技能的局面,必须强化实践技能训练,充分利用 现代信息技术,来提高教学质量和效益,为学生的学习和发展提供丰富多彩的教学环境和有 力的学习工具;
在传授学生统计知识的过程中要注重培养学生对统计课程的思想、情感、态 度、价值观,使学生在获得知识与技能的同时形成正确的、科学的、实事求是的价值观。再 次,学生大都喜欢采用课程论文的形式;同时学生对开卷和多种评价方式的结合比较也认同 ;课程论文的形式对考察学生利用Internet网和图书馆等途径进行资料查询、提出问题、做 出解决的方案(如何抽样、如何进行统计整理、怎样分析、得到什么样的结论等等)、解决实 际问题、信息处理和分析的能力都十分有效,这与有的研究结果[19]相吻合;学生 最不喜欢的是闭卷考试,一方面统计学闭卷考试需要占用大量的时间来进行数据运算,而这些数据运 算是完全可以用现代的计算机软件代替的,另一方面闭卷考试不能考察出学生的统计学知识 与能力。
因此体育统计课程评价需要突出考察学生运用统计知识、统计方法解决实际问题的 能力,这就需要体育统计学课程评价利用多元化过程性评价与终结性评价结合的方式,目的 在于促进学生的发展,体现最新的教育观念和课程评价发展的趋势。
4 结 论
1) 在培养目标上学生需求完善体育统计课程体系以求科学素质全面发展。2) 在教材方面学生需求增加普及计算机辅助的教学内容,特别需要Excel辅助的计算机 统计方法。3) 在教学方面需求教学内容的直观与操作性强的理论与实验结合的教学模式。4) 在课程评价方面学生需求课程评价多元化,考出统计过程和实际操作能力的考核方式。
随着知识经济时代的到来,经济全球化、生活信息化、学习社会化的趋势越来越明显,体育 统计课程面临着新的挑战,时代需要教育培养的人才具有创新精神和实践能力。体育统计课 程在目标方面、学科体系、教学和评价方式等方面仍然需要改革创新,才能满足学生发展、 学科发展和社会发展的需要。
参考文献:
[1] 李健.《体育统计学》教学改革的初步研究与实践[J].体育科技,2004,2 5(2):65-69.
[2] 彭龙辉,肖文辉.体育统计多媒体教学探讨[J].北京体育大学学报,2000,23(1).
[3] 陈红梅,杨军,吴锐创.体育统计学运用多媒体教学实验研究[J].广州体育学院学 报,1998,18(4):115-119.
[4] 关北光,魏佐涛. 信息化与体育统计学科改革和发展方向[J].乐山师范学院学报, 2001,2:94-96.
[5] 李树屏.Excel辅助《体育统计》教学的设计与实践[J].四川体育科学,1999,88(4 ):13-15.
[6] 沈晓强,徐金尧.Excel统计函数的组合技术在体育统计中应用[J].浙江体育科学, 2004,26(4):108-111.
[7] 张必斌,敖运忠.Excel2000中的常用数据分析工具在体育统计上的应用[J].上饶师 范学院学报,2004,24(3).
[8] 赵万龙,宋翠翠.VB开发多功能体育统计软件的研究[J].北京体育大学学报,2000, 23(1):67-68.
[9] 覃朝玲.利用社会科学统计软件辅助“体育统计"教学的探索[J].西南师范大学学报 ,2005(1).
[10] 钟启泉,张华.世界课程改革趋势研究[M].北京:北京师范大学出版社,2001:268 -270.
[11] .泰勒.课程与教学的基本原则[M]. 北京:高等教育出版社,1980:22.
[12] 体育统计学教学大纲[EB/OL].2008-6-12.
[13] 体育统计学教学大纲[EB/OL].
[14] 体育统计课程教学大纲[EB/OL].2008-6-12.
[15] 丛湖平.体育统计(体育学院通用教材)[M].北京:高等教育出版社,1998.
[17] 覃朝玲.计算机统计技术[M].北京:现代教育出版社;2007:1.
[16] 魏登云.体育统计学科建设与发展的立足点—统计思想[J].西安体育学院学报,20 00,17(4):69-72.
[18] 高校传,杨宝山,刘明才.课程目标研究[M].北京:教育科学出版社,2001:98-9 9.
[19] 王美春.《体育统计学》课程建设若干问题的调查与分析[J].北京体育大学学报, 1999,22(4):76-78.
在统计学中,统计模型是指当有些过程无法用理论分析 方法 导出其模型,但可通过试验或直接由工业过程测定数据,经过数理统计法求得各变量之间的函数关系。下文是我为大家整理的关于统计模型论文的 范文 ,欢迎大家阅读参考!
统计套利模型的理论综述与应用分析
【摘要】统计套利模型是基于数量经济学和统计学建立起来的,在对历史数据分析的基础之上,估计相关变量的概率分布,并结合基本面数据对未来收益进行预测,发现套利机会进行交易。统计套利这种分析时间序列的统计学特性,使其具有很大的理论意义和实践意义。在实践方面广泛应用于个对冲基金获取收益,理论方面主要表现在资本有效性检验以及开放式基金评级,本文就统计套利的基本原理、交易策略、应用方向进行介绍。
【关键词】统计套利 成对交易 应用分析
一、统计套利模型的原理简介
统计套利模型是基于两个或两个以上具有较高相关性的股票或者其他证券,通过一定的方法验证股价波动在一段时间内保持这种良好的相关性,那么一旦两者之间出现了背离的走势,而且这种价格的背离在未来预计会得到纠正,从而可以产生套利机会。在统计套利实践中,当两者之间出现背离,那么可以买进表现价格被低估的、卖出价格高估的股票,在未来两者之间的价格背离得到纠正时,进行相反的平仓操作。统计套利原理得以实现的前提是均值回复,即存在均值区间(在实践中一般表现为资产价格的时间序列是平稳的,且其序列图波动在一定的范围之内),价格的背离是短期的,随着实践的推移,资产价格将会回复到它的均值区间。如果时间序列是平稳的,则可以构造统计套利交易的信号发现机制,该信号机制将会显示是否资产价格已经偏离了长期均值从而存在套利的机会 在某种意义上存在着共同点的两个证券(比如同行业的股票), 其市场价格之间存在着良好的相关性,价格往往表现为同向变化,从而价格的差值或价格的比值往往围绕着某一固定值进行波动。
二、统计套利模型交易策略与数据的处理
统计套利具 体操 作策略有很多,一般来说主要有成对/一篮子交易,多因素模型等,目前应用比较广泛的策略主要是成对交易策略。成对策略,通常也叫利差交易,即通过对同一行业的或者股价具有长期稳定均衡关系的股票的一个多头头寸和一个空头头寸进行匹配,使交易者维持对市场的中性头寸。这种策略比较适合主动管理的基金。
成对交易策略的实施主要有两个步骤:一是对股票对的选取。海通证券分析师周健在绝对收益策略研究―统计套利一文中指出,应当结合基本面与行业进行选股,这样才能保证策略收益,有效降低风险。比如银行,房地产,煤电行业等。理论上可以通过统计学中的聚类分析方法进行分类,然后在进行协整检验,这样的成功的几率会大一些。第二是对股票价格序列自身及相互之间的相关性进行检验。目前常用的就是协整理论以及随机游走模型。
运用协整理论判定股票价格序列存在的相关性,需要首先对股票价格序列进行平稳性检验,常用的检验方法是图示法和单位根检验法,图示法即对所选各个时间序列变量及一阶差分作时序图,从图中观察变量的时序图出现一定的趋势册可能是非平稳性序列,而经过一阶差分后的时序图表现出随机性,则序列可能是平稳的。但是图示法判断序列是否存在具有很大的主观性。理论上检验序列平稳性及阶输通过单位根检验来确定,单位根检验的方法很多,一般有DF,ADF检验和Phillips的非参数检验(PP检验)一般用的较多的方法是ADF检验。
检验后如果序列本身或者一阶差分后是平稳的,我们就可以对不同的股票序列进行协整检验,协整检验的方法主要有EG两步法,即首先对需要检验的变量进行普通的线性回归,得到一阶残差,再对残差序列进行单位根检验,如果存在单位根,那么变量是不具有协整关系的,如果不存在单位根,则序列是平稳的。EG检验比较适合两个序列之间的协整检验。除EG检验法之外,还有Johansen检验,Gregory hansan法,自回归滞后模型法等。其中johansen检验比较适合三个以上序列之间协整关系的检验。通过协整检验,可以判定股票价格序列之间的相关性,从而进行成对交易。
Christian L. Dunis和Gianluigi Giorgioni(2010)用高频数据代替日交易数据进行套利,并同时比较了具有协整关系的股票对和没有协整关系股票对进行套利的立即收益率,结果显示,股票间价格协整关系越高,进行统计套利的机会越多,潜在收益率也越高。
根据随机游走模型我们可以检验股票价格波动是否具有“记忆性”,也就是说是否存在可预测的成分。一般可以分为两种情况:短期可预测性分析及长期可预测性分析。在短期可预测性分析中,检验标准主要针对的是随机游走过程的第三种情况,即不相关增量的研究,可以采用的检验工具是自相关检验和方差比检验。在序列自相关检验中,常用到的统计量是自相关系数和鲍克斯-皮尔斯 Q统计量,当这两个统计量在一定的置信度下,显著大于其临界水平时,说明该序列自相关,也就是存在一定的可预测性。方差比检验遵循的事实是:随机游走的股价对数收益的方差随着时期线性增长,这些期间内增量是可以度量的。这样,在k期内计算的收益方差应该近似等于k倍的单期收益的方差,如果股价的波动是随机游走的,则方差比接近于1;当存在正的自相关时,方差比大于1;当存在负的自相关是,方差比小于1。进行长期可预测性分析,由于时间跨度较大的时候,采用方差比进行检验的作用不是很明显,所以可以采用R/S分析,用Hurst指数度量其长期可预测性,Hurst指数是通过下列方程的回归系数估计得到的:
Ln[(R/S)N]=C+H*LnN
R/S 是重标极差,N为观察次数,H为Hurst指数,C为常数。当H>时说,说明这些股票可能具有长期记忆性,但是还不能判定这个序列是随机游走或者是具有持续性的分形时间序列,还需要对其进行显著性检验。
无论是采用协整检验还是通过随机游走判断,其目的都是要找到一种短期或者长期内的一种均衡关系,这样我们的统计套利策略才能够得到有效的实施。
进行统计套利的数据一般是采用交易日收盘价数据,但是最近研究发现,采用高频数据(如5分钟,10分钟,15分钟,20分钟收盘价交易数据)市场中存在更多的统计套利机会。日交易数据我们选择前复权收盘价,而且如果两只股票价格价差比较大,需要先进性对数化处理。Christian L. Dunis和Gianluigi Giorgioni(2010)分别使用15分钟收盘价,20分钟收盘价,30分以及一个小时收盘价为样本进行统计套利分析,结果显示,使用高频数据进行统计套利所取得收益更高。而且海通证券金融分析师在绝对收益策略系列研究中,用沪深300指数为样本作为统计套利 配对 交易的标的股票池,使用高频数据计算累计收益率比使用日交易数据高将近5个百分点。
三、统计套利模型的应用的拓展―检验资本市场的有效性
Fama(1969)提出的有效市场假说,其经济含义是:市场能够对信息作出迅速合理的反应,使得市场价格能够充分反映所有可以获得的信息,从而使资产的价格不可用当前的信息进行预测,以至于任何人都无法持续地获得超额利润.通过检验统计套利机会存在与否就可以验证资本市场是有效的的,弱有效的,或者是无效的市场。徐玉莲(2005)通过运用统计套利对中国资本市场效率进行实证研究,首先得出结论:统计套利机会的存在与资本市场效率是不相容的。以此为理论依据,对中国股票市场中的价格惯性、价格反转及价值反转投资策略是否存在统计套利机会进行检验,结果发现我国股票市场尚未达到弱有效性。吴振翔,陈敏(2007)曾经利用这种方法对我国A股市场的弱有效性加以检验,采用惯性和反转两种投资策略发现我国A股若有效性不成立。另外我国学者吴振翔,魏先华等通过对Hogan的统计套利模型进行修正,提出了基于统计套利模型对开放式基金评级的方法。
四、结论
统计套利模型的应用目前主要表现在两个方面:1.作为一种有效的交易策略,进行套利。2.通过检测统计套利机会的存在,验证资本市场或者某个市场的有效性。由于统计套利策略的实施有赖于做空机制的建立,随着我股指期货和融资融券业务的推出和完善,相信在我国会有比较广泛的应用与发展。
参考文献
[1] . Burgess:A computational Methodolology for Modelling the Dynamics of statistical arbitrage, London business school,PhD Thesis,1999.
[2]方昊.统计套利的理论模式及应用分析―基于中国封闭式基金市场的检验.统计与决策,2005,6月(下).
[3]马理,卢烨婷.沪深 300 股指期货期现套利的可行性研究―基于统计套利模型的实证.财贸研究,2011,1.
[4]吴桥林.基于沪深 300 股指期货的套利策略研究[D].中国优秀硕士学位论文.2009.
[5]吴振翔,陈敏.中国股票市场弱有效性的统计套利检验[J].系统工程理论与实践.2007,2月.
关于半参统计模型的估计研究
【摘要】随着数据模型技术的迅速发展,现有的数据模型已经无法满足实践中遇到的一些测量问题,严重的限制了现代科学技术在数据模型上应用和发展,所以基于这种背景之下,学者们针对数据模型测量实验提出了新的理论和方法,并研制出了半参数模型数据应用。半参数模型数据是基于参数模型和非参数模型之上的一种新的测量数据模型,因此它具备参数模型和非参数模型很多共同点。本文将结合数据模型技术,对半参统计模型进行详细的探究与讨论。
【关键词】半参数模型 完善误差 测量值 纵向数据
本文以半参数模型为例,对参数、非参数分量的估计值和观测值等内容进行讨论,并运用三次样条函数插值法得出非参数分量的推估表达式。另外,为了解决纵向数据下半参数模型的参数部分和非参数部分的估计问题,在误差为鞅差序列情形下,对半参数数据模型、渐近正态性、强相合性进行研究和分析。另外,本文初步讨论了平衡参数的选取问题,并充分说明了泛最小二乘估计方法以及相关结论,同时对半参数模型的迭代法进行了相关讨论和研究。
一、概论
在日常生活当中,人们所采用的参数数据模型构造相对简单,所以操作起来比较容易;但在测量数据的实际使用过程中存在着相关大的误差,例如在测量相对微小的物体,或者是对动态物体进行测量时。而建立半参数数据模型可以很好的解决和缓解这一问题:它不但能够消除或是降低测量中出现的误差,同时也不会将无法实现参数化的系统误差进行勾和。系统误差非常影响观测值的各种信息,如果能改善,就能使其实现更快、更及时、更准确的误差识别和提取过程;这样不仅可以提高参数估计的精确度,也对相关科学研究进行了有效补充。
举例来说,在模拟算例及坐标变换GPS定位重力测量等实际应用方面,体现了这种模型具有一定成功性及实用性;这主要是因为半参数数据模型同当前所使用的数据模型存在着一致性,可以很好的满足现在的实际需要。而新建立的半参数模型以及它的参数部分和非参数部分的估计,也可以解决一些污染数据的估计问题。这种半参数模型,不仅研究了纵向数据下其自身的t型估计,同时对一些含光滑项的半参数数据模型进行了详细的阐述。另外,基于对称和不对称这两种情况,可以在一个线性约束条件下对参数估计以及假设进行检验,这主要是因为对观测值产生影响的因素除了包含这个线性关系以外,还受到某种特定因素的干扰,所以不能将其归入误差行列。另外,基于自变量测量存在一定误差,经常会导致在计算过程汇总,丢失很多重要信息。
二、半参数回归模型及其估计方法
这种模型是由西方著名学者Stone在上世纪70年代所提出的,在80年代逐渐发展并成熟起来。目前,这种参数模型已经在医学以及生物学还有经济学等诸多领域中广泛使用开来。
半参数回归模型介于非参数回归模型和参数回归模型之间,其内容不仅囊括了线性部分,同时包含一些非参数部分,应该说这种模型成功的将两者的优点结合在一起。这种模型所涉及到的参数部分,主要是函数关系,也就是我们常说的对变量所呈现出来的大势走向进行有效把握和解释;而非参数部分则主要是值函数关系中不明确的那一部分,换句话就是对变量进行局部调整。因此,该模型能够很好的利用数据中所呈现出来的信息,这一点是参数回归模型还有非参数归回模型所无法比拟的优势,所以说半参数模型往往拥有更强、更准确的解释能力。
从其用途上来说,这种回归模型是当前经常使用的一种统计模型。其形式为:
三、纵向数据、线性函数和光滑性函数的作用
纵向数据其优点就是可以提供许多条件,从而引起人们的高度重视。当前纵向数据例子也非常多。但从其本质上讲,纵向数据其实是指对同一个个体,在不同时间以及不同地点之上,在重复观察之下所得到一种序列数据。但由于个体间都存在着一定的差别,从而导致在对纵向数据进行求方差时会出现一定偏差。在对纵向数据进行观察时,其观察值是相对独立的,因此其特点就是可以能够将截然不同两种数据和时间序列有效的结合在一起。即可以分析出来在个体上随着时间变化而发生的趋势,同时又能看出总体的变化形势。在当前很多纵向数据的研究中,不仅保留了其优点,并在此基础之上进行发展,实现了纵向数据中的局部线性拟合。这主要是人们希望可以建立输出变量和协变量以及时间效应的关系。可由于时间效应相对比较复杂,所以很难进行参数化的建模。
另外,虽然线性模型的估计已经取得大量的成果,但半参数模型估计至今为止还是空白页。线性模型的估计不仅仅是为了解决秩亏或病态的问题,还能在百病态的矩阵时,提供了处理线性、非线性及半参数模型等方法。首先,对观测条件较为接近的两个观测数据作为对照,可以削弱非参数的影响。从而将半参数模型变成线性模型,然后,按线性模型处理,得到参数的估计。而多数的情况下其线性系数将随着另一个变量而变化,但是这种线性系数随着时间的变化而变化,根本求不出在同一个模型中,所有时间段上的样本,亦很难使用一个或几个实函数来进行相关描述。在对测量数据处理时,如果将它看作为随机变量,往往只能达到估计的作用,要想在经典的线性模型中引入另一个变量的非线性函数,即模型中含有本质的非线性部分,就必须使用半参数线性模型。
另外就是指由各个部分组成的形态,研究对象是非线性系统中产生的不光滑和不可微的几何形体,对应的定量参数是维数,分形上统计模型的研究是当前国际非线性研究的重大前沿课题之一。因此,第一种途径是将非参数分量参数化的估计方法,也称之为参数化估计法,是关于半参数模型的早期工作,就是对函数空间附施加一定的限制,主要指光滑性。一些研究者认为半参数模型中的非参数分量也是非线性的,而且在大多数情形下所表现出来的往往是不光滑和不可微的。所以同样的数据,同样的检验方法,也可以使用立方光滑样条函数来研究半参数模型。
四、线性模型的泛最小二乘法与最小二乘法的抗差
(一)最小二乘法出现于18世纪末期
在当时科学研究中常常提出这样的问题:怎样从多个未知参数观测值集合中求出参数的最佳估值。尽管当时对于整体误差的范数,泛最小二乘法不如最小二乘法,但是当时使用最多的还是最小二乘法,其目的也就是为了估计参数。最小二乘法,在经过一段时间的研究和应用之后,逐步发展成为一整套比较完善的理论体系。现阶段不仅可以清楚地知道数据所服从的模型,同时在纵向数据半参数建模中,辅助以迭代加权法。这对补偿最小二乘法对非参数分量估计是非常有效,而且只要观测值很精确,那么该法对非参数分量估计更为可靠。例如在物理大地测量时,很早就使用用最小二乘配置法,并得到重力异常最佳估计值。不过在使用补偿最小二乘法来研究重力异常时,我们还应在兼顾着整体误差比较小的同时,考虑参数估计量的真实性。并在比较了迭代加权偏样条的基础上,研究最小二乘法在当前使用过程中存在的一些不足。应该说,该方法只强调了整体误差要实现最小,而忽略了对参数分量估计时出现的误差。所以在实际操作过程中,需要特别注意。
(二)半参模型在GPS定位中的应用和差分
半参模型在GPS相位观测中,其系统误差是影响高精度定位的主要因素,由于在解算之前模型存在一定误差,所以需及时观测误差中的粗差。GPS使用中,通过广播卫星来计算目标点在实际地理坐标系中具体坐标。这样就可以在操作过程中,发现并恢复整周未知数,由于观测值在卫星和观测站之间,是通过求双差来削弱或者是减少对卫星和接收机等系统误差的影响,因此难于用参数表达。但是在平差计算中,差分法虽然可以将观测方程的数目明显减少,但由于种种原因,依然无法取得令人满意的结果。但是如果选择使用半参数模型中的参数来表达系统误差,则能得到较好的效果。这主要是因为半参数模型是一种广义的线性回归模型,对于有着光滑项的半参数模型,在既定附加的条件之下,能够提供一个线性函数的估计方法,从而将测值中的粗差消除掉。
另外这种方法除了在GPS测量中使用之外,还可应用于光波测距仪以及变形监测等一些参数模型当中。在重力测量中的应用在很多情形下,尤其是数学界的理论研究,我们总是假定S是随机变量实际上,这种假设是合理的,近几年,我们对这种线性模型的研究取得了一些不错的成果,而且因其形式相对简洁,又有较高适用性,所以这种模型在诸多领域中发挥着重要作用。
通过模拟的算例及坐标变换GPS定位重力测量等实际应用,说明了该法的成功性及实用性,从理论上说明了流行的自然样条估计方法,其实质是补偿最小二乘方法的特例,在今后将会有广阔的发展空间。另外 文章 中提到的分形理论的研究对象应是非线性系统中产生的不光滑和不可微的几何形体,而且分形已经在断裂力学、地震学等中有着广泛的应用,因此应被推广使用到研究半参数模型中来,不仅能够更及时,更加准确的进行误差的识别和提取,同时可以提高参数估计的精确度,是对当前半参数模型研究的有力补充。
五、 总结
文章所讲的半参数模型包括了参数、非参数分量的估计值和观测值等内容,并且用了三次样条函数插值法得到了非参数分量的推估表达式。另外,为了解决纵向数据前提下,半参数模型的参数部分和非参数部分的估计问题,在误差为鞅差序列情形下,对半参数数据模型、渐近正态性、强相合性进行研究和分析。同时介绍了最小二乘估计法。另外初步讨论了平衡参数的选取问题,还充分说明了泛最小二乘估计方法以及有关结论。在对半参数模型的迭代法进行了相关讨论和研究的基础之上,为迭代法提供了详细的理论说明,为实际应用提供了理论依据。
参考文献
[1]胡宏昌.误差为AR(1)情形的半参数回归模型拟极大似然估计的存在性[J].湖北师范学院学报(自然科学版),2009(03).
[2]钱伟民,李静茹.纵向污染数据半参数回归模型中的强相合估计[J].同济大学学报(自然科学版),2009(08).
[3]樊明智,王芬玲,郭辉.纵向数据半参数回归模型的最小二乘局部线性估计[J].数理统计与管理,2009(02).
[4]崔恒建,王强.变系数结构关系EV模型的参数估计[J].北京师范大学学报(自然科学版).2005(06).
[5]钱伟民,柴根象.纵向数据混合效应模型的统计分析[J].数学年刊A辑(中文版).2009(04)
[6]孙孝前,尤进红.纵向数据半参数建模中的迭代加权偏样条最小二乘估计[J].中国科学(A辑:数学),2009(05).
[7]张三国,陈希孺.EV多项式模型的估计[J].中国科学(A辑),2009(10).
[8]任哲,陈明华.污染数据回归分析中参数的最小一乘估计[J].应用概率统计,2009(03).
[9]张三国,陈希孺.有重复观测时EV模型修正极大似然估计的相合性[J].中国科学(A辑).2009(06).
[10]崔恒建,李勇,秦怀振.非线性半参数EV四归模型的估计理论[J].科学通报,2009(23).
[11]罗中明.响应变量随机缺失下变系数模型的统计推断[D].中南大学,2011.
[12]刘超男.两参数指数威布尔分布的参数Bayes估计及可靠性分析[D].中南大学,2008.
[13]郭艳.湖南省税收收入预测模型及其实证检验与经济分析[D].中南大学,2009.
[14]桑红芳.几类分布的参数估计的损失函数和风险函数的Bayes推断[D].中南大学,2009.
[15]朱琳.服从几类可靠性分布的无失效数据的bayes分析[D].中南大学,2009.
[16]黄芙蓉.指数族非线性模型和具有AR(1)误差线性模型的统计分析[D].南京理工大学,2009.
猜你喜欢:
1. 统计学分析论文
2. 统计方面论文优秀范文参考
3. 统计优秀论文范文
4. 统计学的论文参考范例
医学统计论文
医学统计是研究如何搜集、整理和分析医学研究对象的数据和作出推断的一门学科,下面是我为大家收集整理的是医学统计论文,仅供参考。
摘要: 不同的统计分析方法均有其适用的范围和应用的条件,研究者在书写医学论文时应根据论文设计及资料的类型进行合理的试验设计,选择恰当的统计分析方法,切记勿盲目套用。同时,还应注意得出的结果和结论应满足设计的要求。医学统计方法的正确运用,是充分利用试验研究获得的数据,也是最终得出科学、可信的结论的必要条件。
关 键词 :医学统计;方法;运用;原理;选择
一、统计学方法简介
统计学方法包括统计软件包、统计分析方法以及检验水准三方面的内容。其中医学论文中常提到检验水准即α,它是用来表示组间实际无差别而统计结果判断有差别,犯这类错误的概率。实际工作中常取α=,当研究数据计算的P值小于时,组间差异比较被认为有统计学意义。统计学方法包括统计描述和假设检验两个方面的内容。统计描述是指根据资料及原始数据分布的类型,选择正确的指标来描叙资料及数据的特征。而假设检验即组间差异性检验,是医学论文中最常用的统计学方法。资料类型则包括能用具体数据表示的定量资料与不能用具体数值表示但能反映被观察对象某一特征的定性资料。定性资料的统计描述包括率、相对比和构成比。而参数法及非参数法是常用的定量资料统计分析方法。参数法一般包括t检验、方差分析,非参数法常用的有秩和检验。
二、试验设计中的统计学原理
合理的试验设计与统计处理的可信度存在直接联系,研究者在编写医学论文时应对医学研究设计方法进行说明。在进行试验设计时应遵循随机、对照、均衡和重复四大原则。在进行试验设计的时候通常会涉及到研究对象的选择,研究对象的分组及选择合理的检测指标三个方面的内容。
医学论文就是通过对样本的研究来进行推断总体,找出其共性,得出结论。因此研究者在选择研究对象时应注意选择样本应具有一定数量,能反映出该事物的规律性特征,但又应注意例数不能太多,以免造成不必要的浪费。其选择的原则就是在保证试验结果可靠性的前提下选择最少的样本例数。研究者在选择样本对象后应对其基本特征进行详细的描述,比如患者的年龄、性别、病理分期、疾病诊断的标准等。此外在试验中所用到的试剂、仪器的型号、规格等都应作出说明,以供读者借鉴和做出判断。选定好研究对象后就要对其进行分组。在进行分组时研究者一般遵循统计学中的“随机分配”、“设立对照”以及“均衡”、“重复”的原则。随机化原则是提高组间均衡性的一个重要手段,也是资料分析时进行统计推断的前提。有对照才有比较,在进行组间比较时,应确定好处理因素与实验效应的关系。均衡性则是要使得对结果产生影响的非处理因素尽可能保持一致,这样才能保证对照的结果让人信服。观察实验效应的.指标主要有主观指标与客观指标。正所谓主观指标就是通过问答的方式调查受试者自己判断的主观感受;而客观指标则是通过仪器来检验和测量所得出的结果。在进行试验设计时应选择客观性较强、高灵敏性和精确性的指标。
三、统计学方法的选择
统计学方法的正确选择是直接影响到论文结论可信度的重要依据,因此研究者在编写论文时应注意选择合适的统计学方法。不同的统计学方法应用的范围不同。研究者在编写医学论文时常根据论文研究的目的、资料类型、试验设计的方案、样品大小、水平数、特定条件、数据分布特征以及综合分析等来选择对应的统计方法,同时还要根据专业知识与资料的实际情况,结合统计学原则,灵活地选择。当定性资料正态分布时,研究者一般用均数和标准差来表示统计描述指标;当定性资料不符合正态分布时,则可选用中位数及级差来表示;当定量资料正态分布且组间方差齐时一般选用参数法,反之则选用非参数法。t检验一般适用于小样本(n<50)的定量资料且方差齐的两组数据之间的比较。其特点是在均方差不知道的情况下,可以检验样本平均数的显著性,大样本(n≥50)采用u检验;多个样本均数两两比较则用方差分析,如差异有统计学意义,可采用q检验;Dunnett检验则适用于多个实验组与一个对照组均数的比较。定性资料中,表现为互不相容的类别或属性,分为二分类和多类反应,如治疗结果为显著和好转的人数等,该种资料可选用字检验,大样本(n≥50)时采用u检验。如:患者的治疗结果评定为痊愈、显著有效、好转、无效或死亡。该种资料可选用秩和检验或u检验。总之,不论论文中选用的是哪种统计学方法,都要计算出检验值,然后再根据统计量值来判定P值的大小,结论一般描述为“差异有(无)统计学意义”。
四、常见统计学方法的误用分析及对策
1.统计方法误用。最常见统计方法误用是对等级资料进行比较时应用秩和检验而误用卡方检验。例如:在评价采取不同治疗方法的两组急性脑血管病患者疗效中,治疗组显著有效、有效、无效三种分型分别为15例、10例、8例,对照组分别为14例、11例、9例。本资料例数较少,应选用等级比较的秩和检验,而有些作者却认为只要是率的比较就可以采用字检验。研究者在选择统计学方法时应根据相应的原则,对文章研究目的、资料类型、样品大小、水平数、数据分布特征等进行综合分析后,再来选择对应的统计方法。
2.选用检验方法错误。在有些论文中,作者常将本应用方差分析和q检验的误用t检验。t检验一般适用于小样本(n<50)定量资料且方差齐的两组数据之间的比较,而方差分析及q检验主要用于对多个样本均数进行比较,几种不同治疗或处理方法等的同时比较。例如:在讨论中、西以及中西医结合治疗急性脑血管病时,两组患者的年龄、病程、病情严重程度等差别均无统计学意义,比较三组患者的一些指标变化。组间多重比较应用q检验,但文中作者采用的是t检验,对三组均数进行两两比较。这不仅造成了资料的利用率低,也增加了假阳性的概率,降低了试验结果的可信度。
五、结论表述中的统计学应用
资料的统计处理不是医学研究工作的最终目的,而是通过统计学分析为研究结论提供依据或者线索。因此,在对统计资料进行分析后应把握统计学术语,对结论做出科学的分析跟解释。在根据统计结果得出专业结论时研究者应遵循一个重要原则,就是统计结论都是概率性的,不能绝对地肯定或否定。研究者习惯上将“P<”称为显著性,不应误解为差别很大或者在医学上有显著的价值。统计推断是以一定的概率界值为依据,说明来自同一总体的可能性大小。“差异有统计学意义”说明在试验中的差异不能用抽象误差进行解释;“差异无统计学意义”表明在试验既定的条件下,差异可能是因抽象误差引起的,在增加样本数量的情况下,差异可能变成“有统计学意义”。
参考文献:
[1]医学统计工作的基本内容[J].国际检验医学杂志,2013(19):2563.
[2]关红阳,郭轶男.医学统计t检验的分析研究[J].中国校外教育,2013(30):114.
159 浏览 3 回答
269 浏览 3 回答
264 浏览 3 回答
116 浏览 2 回答
85 浏览 4 回答
243 浏览 2 回答
302 浏览 2 回答
105 浏览 2 回答
88 浏览 2 回答
338 浏览 3 回答
90 浏览 3 回答
281 浏览 3 回答
81 浏览 2 回答
164 浏览 3 回答
247 浏览 3 回答