人们对文献定量化的研究, 可以回溯到 20世纪初。1917年F.J.科尔和N.B.伊尔斯首先采用定量的方法,研究了1543~1860年所发表的比较解剖学文献,对有关图书和期刊文章进行统计,并按 国别加以分类。1923 年E.W.休姆提出“文献统计学”一词,并解释为:“通过对书面交流的统计及对其他方面的分析,以观察书面交流的过程,及某个学科的性质和发展方向。”1969年文献学家 A.普里查德提出用文 献计量学代替文献统计学,他把文献统计学的研究对象由期刊扩展到所有的书刊资料。目前,文献计量学已成为情报学和文献学的一个重要学科分支。同时也展现出重要的方法论价值,成为情报学的一个特殊研究方法。在情报学内部的逻辑结构中,文献计量学已渐居核心地位,是与科学传播及基础理论关系密切的学术环节。现在全世界每年发表的文献计量学学术论文约为400~500篇。
1.文献计量学的理论
中国早在数年前就提出“科教兴国”的战略口号,邓小平同志也说“科技是第一生产力”,江泽民同志“三个代表”重要思想更是强调“共产党人必须是先进文化的代表”,而学术期刊是科技及先进文化的载体,面对世界经济日趋一体化的趋势,面对信息通讯技术及信息处理现代化方式日臻完善的今天,作为载体的学术期刊就应先行一步,高瞻远瞩这是形势使然。
科学技术研究的最终结果主要表现在发表科技论文、科技成果获奖和取得社会与经济效益三个方面。科技论文一般指在专业学术刊物上公开发表、具有一定学术水平的研究性论文,它是科技活动和科技成果的主要表现形式,是科学研究最直接产出形式之一。科技论文的数量和质量,一定程度上反映了科学研究的成果和效率,特别是论文的水平,是评价一个国家、一个单位以及科研人员科技能力和水平的一项重要指标。通过对科技论文的定量分析进而对科技产出能力和科技水平进行整体评价,国内外管理人员进行了许多有益的研究和尝试,如利用模糊数学模型分析等方法。其中,文献计量学分析方法是近年来广泛应用的定量分析方法之一。
文献计量学是一门新兴学科。它从定量的角度出发,采用数学、统计学等计量方法,通过对文献特征的统计分析,来研究文献体系的分布、结构、数量关系和定量管理,进而探讨文献的变化规律和科学管理。近几年来,文献计量学的研究成果被广泛应用于情报学以外的科学技术领域中,其中一个重要方面就是将文献计量学指标用于科学技术生产效率的评价,使决策者可以对科技研究进行有效的定量化管理。简单的文献计量学指标,例如出版著作数、发表论文数、被引用次数等等,已经被广泛应用于部门中作为考核、奖惩、晋升职工的评估依据。这些简单指标的组合,就可以评价大学、研究所、工业公司以至整个国家的科技水平与影响能力。在近10年中,文献计量学得到了很大的发展,取得了许多成果,各方面更趋成熟,研究层次更趋深入,定量化描述的手段与方法也日益改善。同时寻求更系统全面的数据集合,更现代化的文献数据处理手段,最终有效地指导文献情报工作。
近几年来,文献计量学的应用范围不断拓宽,应用研究的力度明显加大,特别是在科技管理与决策中的应用越来越受到有关领导部门和研究者的重视。国外对此十分重视,例如,美国、英国、匈牙利、印度等许多国家不仅把文献计量指标作为科学计量学指标体系中的重要组成部分,而且还从管理的高度,认为它是衡量一个国家科学文化水平乃至综合国力的一种重要途径和有效方法。早在20世纪60年代,美国就开始编制《科学引文索引》(SCI)。这一大型索引的出版和发行,为文献计量学研究提供了一种多功能的有力工具,一定程度上解决了文献计量学应用所必需的大量数据,有效地推动了文献计量学的全面发展,被誉为文献计量学史上具有划时代意义的研究成果。可以说,没有SCI就没有现代的文献计量学。我国著名学者赵红洲、蒋国华等人曾经利用文献计量方法,排出了我国主要大学发表论文的名次,并以“学术榜”的名义在报纸上公布后,引起了社会各界的强烈反响,并受到国家科委、中国科学院和国家自然科学基金会领导的高度重视。从1987年起,国家科委为了从一个侧面评价我国学科发展、科技投入产出情况及科研机构和科技人员的成就,委托中国科技情报研究所(今改名为中国科技信息研究所)利用ISI的三套出版物,对我国学者从1983年以来发表的论文情况进行统计分析。接着,国家科委专门下达资助课题,要求中国科技信息研究所进行更大范围、更系统的文献信息统计分析,对我国科技水平在世界上所处的地位以及主要大学、科研院、所的科学生产能力和学术水平作出客观评价,并逐步形成制度,每年召开一次新闻发布会,公布有关统计结果。中国科学院文献信息中心从1998年起也逐年出版《中国科学计量指标:论文与引文统计》(简称《指标集》)。集内有100多项统计指标,运用科学计量学和文献计量学的有关方法,对我国科技论文的产出力和影响力及其分布情况从总体上进行了客观的描述。该书的内容包括:统计源概貌,机构研究计量统计,国家重点实验室和部门开放实验室研究计量指标,地区研究计量指标,科技基金计量指标,合作研究计量指标,人才研究计量指标,文献评价计量指标。近几年来,国家自然科学基金会连续资助了6项文献计量学和科学计量学方面的研究课题,促使其研究上规模、上档次、上水平,从而有力地推动了文献计量学的深入发展。由于文献计量指标的评价功能与其它社会评价指标的功能是一致的,而且其研究成果和计量数据可以为有关部门的管理和决策提供定量依据与支持,因而越来越受到有关领导和管理部门的广泛重视。这一重要进展表明,文献计量学的某些内容和方法正在由课题研究向事业化方向发展,成为国家科技文化事业的一个组成部分。这有利于文献计量学冲破传统的局限,增强其渗透力和辐射力,大步进入“科技圈”、“管理圈”、“决策圈”,在更大的范围内充分发挥其作用,从而进一步得到社会各界的承认和重视。这是90年代以来文献计量学研究和应用发展的显著特点与趋势之一。
2.国内外地学文献统计分析系统
国内外地学文献统计分析系统建立的背景
文献计量学的应用是建立在大量数据的基础上的,因此必须利用计算机等现代化手段建立正规的文献信息计量工具,为应用提供大规模数据的获取渠道和来源,必须依托较为适宜的文献数据库才能进行。目前国内文献计量学研究大多利用SCI为数据源进行统计研究,但在本研究进行项目调研中发现SCI创建时间较短,在可追溯性方面不如一些历史悠久的传统检索工具(如地质学方面有200多年收录史的GeoRef),虽然SCI收录5000多种期刊,但由于其专业覆盖面很广,故每个学科的收录数量都不够。并且SCI对各学科的重视程度不同,所以各科学间的数据不具备可比性。此外SCI中没有“分类号”一项,不能按学科进行分类检索,因此用它进行某学科的统计就很困难,一些文献统计项目为了用SCI进行各学科综合统计研究不得不花费大量人力对原始数据重新进行分类等加工、录入,这一点可反映出数据源选定的是否得当在很大程度上影响着统计工作的结果和效率。可以认为利用SCI对国内外地球科学进行分学科和领域论文分布及其变化趋势分析,论文使用的分析测试方法统计分析,论文研究的区域分布统计分析,论文提出的新理论和新方法无法满足要求,因此,本项目组自行设计并完成了国内外地学文献统计分析系统。
国内外地学文献统计分析系统
国内外地学文献统计分析系统应用数据库技术和公共查询系统技术实现对地学文献数据的存储、查询、分析、输出,实现地学文献的信息化管理。
(1)系统运行环境:
a.服务器:WINDOWS NT及其以上平台,PIII 800、RAM/256M、Disk/20G;
b.客户机:DINDWOS 9X或WINDOWS NT及其以上平台,PII 350、RAM/64M、Disk/9G;
c.网络:互联网;
d.数据库:MS-SQL 2000。
(2)系统结构:
国内外地学期刊统计分析系统的设计采用了三级B/S体系结构,三层结构包括客户机、应用服务器、Web服务器、数据库服务器。这种方式又称瘦客户机系统,在客户机端没有或者有很少的应用代码。客户机负责数据结果的显示和用户请求的提交。应用服务器和Web服务器负责响应和处理用户的请求。而数据库服务器负责数据的管理工作。所有的空间数据和应用程序都放在服务器端,客户端只是提出请求,所有的响应都在服务器端完成。其中,Web服务器位于系统的中间,是原型系统的枢纽与核心部分,是系统设计和实现的关键。系统结构如图1所示。系统前端是Client/Brower,中间是Web Server,后端是Sql Server。
图1 国内外地学文献统计分析系统应用的结构图
(3)系统总体功能:
a.数据库管理:实现数据输入与维护、查询、显示输出等,系统也提供Web环境下的数据管理,数据信息可在远程或本地进行编辑、浏览、维护。
b.系统可进行文献计量统计初评估、总评估:依据文献查询结果进行学科、主题、作者、研究单位、研究区域等相关度的统计和分析。
c.数据交换功能:系统可通过转换工具将数据转换为其它标准格式,如2709等国标数据。
d.系统具有完整的桌面管理和帮助系统。
(4)系统构成框图(图2)与主要功能图(图3)。
图2 国内外地学文献统计分析系统的构成框图
(5)系统的开发和应用环境:在中文WIN2000下利用SQL2000、ULTRADEV、VBSCRIPT进行开发。
国内外地学文献统计分析系统数据源选定
国内外地学期刊统计分析系统建库主要收集和利用《GeoRef检索系统》(以下简称GeoRef)、《中国地质文献库及检索系统》(以下简称GDS)作为数据源,GeoRef是中国地质图书馆在1982年开始引进的美国地质调查所信息中心所建的地学文献数据库,该数据库收录了北美地区自1785 年以来的和世界上其它地区自1933年以来的地质文献,包含了地球科学领域国际上公认的5000余种期刊、会议资料等,总共约220万余条,其收录范围覆盖了地球科学近40 个类目,是目前国际最权威的地质学文献检索数据库。GDS由中国地质图书馆所建,收录1985 年至今的400 余种期刊、专著、论文集和国际会议中文资料,累积文献量达20 余万条,收录范围基本覆盖了地球科学、土地科学等40个类目,是我国地球科学和土地科学研究领域最大型的检索系统,是国内最权威的地质学文献数据库。选取上述两个数据库作为本系统数据源的主要原因是:①GDS的基本结构和选刊原则等诸多方面与GeoRef接轨,建库依据了文献计量学的结果;②两种数据库均有较为严格选刊标准,收录文献的种类较多,即将国家级单位主持的地球科学类专业杂志悉数收录,也将一些地方主办、流通区域有限因而影响较小的地球科学杂志收录;③两种数据库收录时间较长,GeoRef已有200年数据,GDS的数据年限已有近19年,非常适合于我们对多年来地球科学论文情况进行分析;④两种数据库的分类系统设立既遵循了地球科学的学科分类,又是从检索文献的实际需要出发,并且GDS是参考了GeoRef的类目名(表1、表2)。所以根据GeoRef和GDS得到的分析结果应该是代表国内外地球科学研究水平。不足之处是两种数据库都缺少引文分析。
图3 国内外地学期刊统计分析系统的主要功能示意图
表1 GeoRef数据各学科使用代码列表
表2 GDS数据各学科使用代码列表
续表
3.国内外地学期刊统计分析实例
国内外地学期刊统计分析是利用国内外地学文献统计分析系统,检索提取科技人员和研究机构发表论文数量的统计数据,进行科技人员群落及研究机构的学术榜的测定;检索提取分类统计数据,进行相关学科的学科体系演变和发展趋势分析。
国内研究机构论文数量的统计分析
国内外地学期刊统计分析系统框架结构中的选项有:题目、作者/单位、刊名、出版社、出版年、卷、页、文献索取号、语言、载体形态、关键词、分类号、文献识别号、记录状态、文献类型、目录级别、文献载体、ISSN号、ISBN号、会议、版次。如想了解我国近年来各研究机构发表论文的情况,通过系统选择框架结构中“出版年”,输入“年代(1997、1998、…2001)”,检索出各年代收录的全部文献,再选择系统框架结构中的“作者/单位”输入、并通过Excel运算处理,即可得到如下的统计数据(表3)。
表3 国内外地学期刊统计分析系统1997~2001年收录国内研究机构论文数量
国内外学科结构统计分析
利用国内外文献统计分析系统对GeoRef数据库100年、GDS数据库15年期刊论文进行学科的统计分析,数据采集的方法是利用分析系统框架结构中的“分类号”进行检索,GeoRef数据库的检索式:分类号的字段代码、GDS数据库的检索式:选择检索系统框架结构中的“分类号”,输入分类代码,采用上述方法我们采集了国外100年、国内15年的分类数据,编制了国际地质科学体系学科结构的百年演变图及国内地质学科体系学科结构近20年演变图(详见第一章)。
中外综合性期刊地学论文对比研究
(1)《科学通报》、《中国科学(D辑)》、《Nature》和《Science》的地学学科结构的统计分析
《Nature》和《Science》分别是英国和美国主办的世界顶尖的综合性科学杂志,所发表的地学文章一般都反映了地质科学研究的一些重要进展。而《中国科学(D辑)》、《科学通报》也可以算是我国顶尖的综合性科学杂志,4种杂志的学科结构,反映了近年来地质科学基础和前沿研究领域及其变化趋势。
比较4种期刊可知,第四纪地质学方面的论文数都居于其它学科之上,说明近年来对第四纪地质与全球变化科学研究日趋重视。词频统计结果也表明与其相关的术语出现最多,如“第四纪”、“新生代”、“全新世”等。因为第四纪从时间上离人类活动的历史最近,因此研究第四纪地质、环境、气候变化等,无不与我们人类的生存这个重大问题密切相关。《Science》和《Nature》上关于宇宙地质(或球外地质)的论文排名在前5位,比在《中国科学》《科学通报》上的排名要靠前。球外地质实际上也是一个涉及到未来人类居住环境的重要科学问题,当然它还反映了我们对地球起源等根本问题的不懈探索。之所以国内这方面的论文还比较少,其原因可能是多方面的,主要可能与国家经济实力、技术设备水平有关,其次是对人类环境问题的关注程度。另一方面,从统计结果中可以清楚地看出,在国外两著名期刊上关于经济地质(包括矿产、能源等)方面的论文数量较少,而国内两大期刊在油气地质、金属矿床两类论文数量均名列前茅,这与我国是发展中国家,对矿产、能源的需求量大有关。另外,地质找矿仍然在我国地质工作中占相当大比重,这方面的成果(论文)也就很多。
(2)《Nature》和《Science》国别分布的统计分析
从表4、表5可看出,前10位除中国之外都是当今世界上经济最发达的国家,尤其是美国更是遥遥领先,英、法、德为第二梯队,明显落后于美国。这表明只有经济上相对强大了,科技的发展才能得到有力支持。中国自20世纪90年代以来,经济发展较快,也很重视科技对社会生产力的推动作用,因而加大了对科技的投入,之所以能够跻身前10强,说明我国在地学领域已取得了一些领先水平的研究成果。
表4 在《Science》1996~2001年发表地学论文数前10位的国家
图4反映了过去20多年以来我国在国际著名期刊上发表地学论文的情况,论文数量总体上呈上升趋势,尤其近6年以来迅速攀升,表明我国地学研究在某些方面已经受到国际上的重视。
表5 在《Nature》1996~2001年发表地学论文数前10位的国家
图4 近年来我国学者在《Science》、《Nature》上发表的地学论文数量变化曲线
(3)《中国科学(D辑)》、《科学通报》、《Nature》和《Science》机构分布的统计分析
对《中国科学(D辑)》、《科学通报》、《Nature》和《Science》4种期刊1996~2001年每一年不同单位发表论文数的多少进行了排序,从图5、图6看,在《Nature》上大学、研究所、国际组织、公司和其他分别占58%、28%、15%、11%、0.2%;《Science》上大学、研究所、国际组织、公司和其他分别占47%、27%、0.4%、0.05%、24%,大学所占比重最大,其次为研究所。这与《中国科学(D辑)》、《科学通报》情况完全相反(表6、表7)。
从表6、表7中可以看出,我国发表地学论文最多的单位是研究所,其次才是大学或学院。按发表论文的多少进行排序的结果表明,中科院地质所、地球物理所及其所属各实验室发表论文数最多,其次为地科院、地震局、海洋局等所属研究所。中科院论文数遥遥领先于其它研究所。大学中学术论文数量较多的是中国地质大学(武汉)、中国地质大学(北京)、南京大学、北京大学、西北大学、同济大学(排名未分先后)。
图5《Nature》1996~2001年发表地学论文机构分布
图6《Science》1996~2001年发表地学论文机构分布
表6《中国科学D辑》1996~2001年发表论文作者单位分类统计
表7《科学通报》1996~2001年发表论文作者单位分类统计
中外期刊地学论文研究领域的对比分析
根据选定的国内外地学期刊统计分析系统数据源,采集和分析了16000多个数据,从而对矿物学、地球化学、岩石学、古生物地史学及地层学、构造地质学、矿床地质学、地球物理学、第四纪地质学与全球变化、环境地质学、工程地质学、能源地质学、行星与宇宙地质学、海洋地质学、地质年代学、地质观测技术等研究学科和领域进行了专题调研,反映了研究领域的变化趋势(详见学科分述部分)。
计量经济学论文可以研究的问题有多种,期中比较简单的就是根据数据,建立方程,研究变量之间的关系,主要运用的工具就是计量经济学的初等知识和Eviews软件,思路、要求和注意事项我觉得这么说对你的帮助不大,所以给你一篇我的论文做参考,也许对你有帮助,如果你觉得看的不是很明白的话,可以再留言给我,我把什么思路等告诉你。计量经济学期末实验报告实验名称:大中城市城镇居民人均消费支出与其影响因素的分析姓 名:学 号:班 级: ()级统计学系()班指导教师:时 间:(上面是论文封皮)23个城市城镇居民人均消费支出与其影响因素的分析(题目)一、 经济理论背景近几年来,中国经济保持了快速发展势头,投资、出口、消费形成了拉动经济发展的“三架马车”,这已为各界所取得共识。通过建立计量模型,运用计量分析方法对影响城镇居民人均消费支出的各因素进行相关分析,找出其中关键影响因素,以为政策制定者提供一定参考,最终促使消费需求这架“马车”能成为引领中国经济健康、快速、持续发展的基石。二、 有关人均消费支出及其影响因素的理论我们主要从以下几个方面分析我国居民消费支出的影响因素:①、居民未来支出预期上升,影响了居民即期消费的增长居民的被动储蓄直接导致购买力的巨大分流, 从而减弱对消费品的即期需求,严重地影响了居民即期消费的增长,进而导致有效需求的不足,最终导致经济增长的乏力。90年代末期以来,我国的医疗、养老、失业保险、教育等一系列改革措施集中出台,原有的体制被打破,而新的体制尚未建立健全,因此目前的医疗、养老、失业保险、教育体制对居民个人支出的压力较大,而且基本上都是硬性支出,支出的不确定性也很大,导致居民目前对未来支出预期的上升。②、商品供求结构性矛盾依然突出从消费结构上看,我国消费品市场已发生了新的根本性变化:居民低层次消费已近饱和,而更高水平的消费又未达到。改革开放20多年来,城乡居民经过了一个中档耐用消费品的普及阶段后,目前老百姓的收入消费还不足以形成一个新的、以高档产品为内容的主导性消费热点,如轿车、住房等还远不能纳入大多数人的消费主流,居民现有的购买力不能形成推动主导消费品升级的动力。③、物价总水平持续在低水平运行,通货紧缩的压力较大,不利于消费的增长加入WTO之后,随着关税的降低和进口规模的扩大,国外产品对我国市场的冲击将进一步加大,国际价格紧缩对国内价格变化将产生负面影响。物价的持续下降,不利于居民的消费增长。因为从居民的消费心理上看,买涨不买降是居民购物的习惯心理。由于居民对物价有进一步下降的预期,因此往往推迟消费,不利于居民消费的增长。另外,从统计上分析,由于物价的下降,名义消费增长往往低于实际消费的增长,这在一定程度上也不利于消费增长幅度的提高。④、我国现阶段没有形成大的消费热点,难以带动消费的快速增长经过近几年的培育和发展,我国目前已经形成了住房消费、居民汽车消费、通信及电子产品的消费、节假日消费及旅游消费等一些消费亮点,可以促进消费的稳定增长,但始终未能形成大的消费热点,因此不能带动消费的高速增长。三、 相关数据收集相关数据均来源于2006年《中国统计年鉴》:23个大中城市城镇居民家庭基本情况(表格)地区 平均每户就业人口(人) 平均每一就业者负担人数(人) 平均每人实际月收入(元) 人均可支配收入(元) 人均消费支出(元)北京 1.6 1.8 1865.1 1633.2 1187.9天津 1.4 2.0 2010.6 1889.8 939.8石家庄 1.4 2.0 1061.3 1010.0 722.9太原 1.3 2.2 1256.9 1159.9 789.5呼和浩特 1.5 1.9 1354.2 1279.8 772.7沈阳 1.3 2.1 1148.5 1048.7 812.1大连 1.6 1.8 1269.8 1133.1 946.5长春 1.8 1.7 1156.1 1016.1 690.2哈尔滨 1.4 2.0 992.8 942.5 727.4上海 1.6 1.9 1884.0 1686.1 1505.3南京 1.4 2.0 1536.4 1394.0 920.6杭州 1.5 1.9 1695.0 1464.9 1264.2宁波 1.5 1.8 1759.4 1543.2 1271.4合肥 1.6 1.8 1042.5 950.1 686.9福州 1.7 1.9 1172.5 1059.4 942.8厦门 1.5 1.9 1631.7 1394.3 998.7南昌 1.4 1.8 1405.0 1321.1 665.4济南 1.7 1.7 1491.3 1356.8 1071.4青岛 1.6 1.8 1495.6 1378.5 1020.7郑州 1.4 2.1 1012.2 954.2 750.3武汉 1.5 2.0 1052.5 972.2 853.1长沙 1.4 2.1 1256.9 1148.9 986.8广州 1.7 1.8 1898.6 1591.1 1215.1四、 模型的建立根据数据,我们建立多元线性回归方程的一般模型为:其中:——人均消费支出——常数项——回归方程的参数——平均每户就业人口数——平均每一就业者负担人口数——平均每人实际月收入——人均可支配收入——随即误差项五、实验过程(一)回归模型参数估计根据数据建立多元线性回归方程:首先利用Eviews软件对模型进行OLS估计,得样本回归方程。利用Eviews输出结果如下:Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:08Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C -1682.180 1311.506 -1.282633 0.2159X1 564.3490 395.2332 1.427889 0.1704X2 569.1209 379.7866 1.498528 0.1513X3 1.552510 0.629371 2.466766 0.0239X4 -1.180652 0.742107 -1.590947 0.1290R-squared 0.721234 Mean dependent var 945.2913Adjusted R-squared 0.659286 S.D. dependent var 224.1711S.E. of regression 130.8502 Akaike info criterion 12.77564Sum squared resid 308191.9 Schwarz criterion 13.02249Log likelihood -141.9199 F-statistic 11.64259Durbin-Watson stat 2.047936 Prob(F-statistic) 0.000076根据多元线性回归关于Eviews输出结果可以得到参数的估计值为: , , , ,从而初步得到的回归方程为:Se= (1311.506) (395.2332) (379.7866) (0.629371) (0.742107)T= (-1.282633) (1.427889) (1.498528) (2.466766) (-1.590947)F=11.64259 df=18模型检验:由于在 的水平下,解释变量 、 、 的检验的P值都大于0.05,所以变量不显著,说明模型中可能存在多重共线性等问题,进而对模型进行修正。(二)处理多重共线性我们采用逐步回归法对模型的多重共线性进行检验和处理:X1:Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:28Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 153.8238 518.6688 0.296574 0.7697X1 523.0964 341.4840 1.531833 0.1405R-squared 0.100508 Mean dependent var 945.2913Adjusted R-squared 0.057675 S.D. dependent var 224.1711S.E. of regression 217.6105 Akaike info criterion 13.68623Sum squared resid 994441.2 Schwarz criterion 13.78497Log likelihood -155.3917 F-statistic 2.346511Durbin-Watson stat 1.770750 Prob(F-statistic) 0.140491X2:Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:29Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 1756.641 667.2658 2.632596 0.0156X2 -424.1146 347.9597 -1.218861 0.2364R-squared 0.066070 Mean dependent var 945.2913Adjusted R-squared 0.021597 S.D. dependent var 224.1711S.E. of regression 221.7371 Akaike info criterion 13.72380Sum squared resid 1032515. Schwarz criterion 13.82254Log likelihood -155.8237 F-statistic 1.485623Durbin-Watson stat 1.887292 Prob(F-statistic) 0.236412X3:Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:29Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 182.8827 137.8342 1.326831 0.1988X3 0.540400 0.095343 5.667960 0.0000R-squared 0.604712 Mean dependent var 945.2913Adjusted R-squared 0.585888 S.D. dependent var 224.1711S.E. of regression 144.2575 Akaike info criterion 12.86402Sum squared resid 437014.5 Schwarz criterion 12.96276Log likelihood -145.9362 F-statistic 32.12577Durbin-Watson stat 2.064743 Prob(F-statistic) 0.000013X4:Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:30Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 184.7094 161.8178 1.141465 0.2665X4 0.596476 0.124231 4.801338 0.0001R-squared 0.523300 Mean dependent var 945.2913Adjusted R-squared 0.500600 S.D. dependent var 224.1711S.E. of regression 158.4178 Akaike info criterion 13.05129Sum squared resid 527020.1 Schwarz criterion 13.15003Log likelihood -148.0898 F-statistic 23.05284Durbin-Watson stat 2.037087 Prob(F-statistic) 0.000096由得出的数据可以看出, 的调整的判定系数最大,因此首先把 引入调整的方程中,然后在分别引入变量 、 、 进行OLS得:X1、X3Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:32Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C -222.8991 345.9081 -0.644388 0.5266X1 289.8101 227.2070 1.275533 0.2167X3 0.517213 0.095693 5.404899 0.0000R-squared 0.634449 Mean dependent var 945.2913Adjusted R-squared 0.597894 S.D. dependent var 224.1711S.E. of regression 142.1510 Akaike info criterion 12.87276Sum squared resid 404138.2 Schwarz criterion 13.02087Log likelihood -145.0368 F-statistic 17.35596Durbin-Watson stat 2.032110 Prob(F-statistic) 0.000043X2、X3Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:33Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 239.5536 531.1435 0.451015 0.6568X2 -27.00981 244.0392 -0.110678 0.9130X3 0.536856 0.102783 5.223221 0.0000R-squared 0.604954 Mean dependent var 945.2913Adjusted R-squared 0.565449 S.D. dependent var 224.1711S.E. of regression 147.7747 Akaike info criterion 12.95036Sum squared resid 436747.0 Schwarz criterion 13.09847Log likelihood -145.9292 F-statistic 15.31348Durbin-Watson stat 2.063247 Prob(F-statistic) 0.000093X3、X4Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:34Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 331.7015 142.5882 2.326290 0.0306X3 1.766892 0.553402 3.192782 0.0046X4 -1.473721 0.656624 -2.244390 0.0363R-squared 0.684240 Mean dependent var 945.2913Adjusted R-squared 0.652664 S.D. dependent var 224.1711S.E. of regression 132.1157 Akaike info criterion 12.72634Sum squared resid 349091.0 Schwarz criterion 12.87445Log likelihood -143.3529 F-statistic 21.66965Durbin-Watson stat 2.111635 Prob(F-statistic) 0.000010由数据结果可以看出,引入X4时方程的调整判定系数最大,且解释变量均通过了显著性检验,再分别引入X1、X2进行分析。X1、X3、X4Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:37Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 193.6693 403.8464 0.479562 0.6370X1 89.29944 243.6512 0.366505 0.7180X3 1.652622 0.646003 2.558228 0.0192X4 -1.345001 0.757634 -1.775265 0.0919R-squared 0.686457 Mean dependent var 945.2913Adjusted R-squared 0.636950 S.D. dependent var 224.1711S.E. of regression 135.0712 Akaike info criterion 12.80625Sum squared resid 346640.3 Schwarz criterion 13.00373Log likelihood -143.2719 F-statistic 13.86591Durbin-Watson stat 2.082104 Prob(F-statistic) 0.000050X2、X3、X4Dependent Variable: YMethod: Least SquaresDate: 12/11/07 Time: 16:38Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 62.60939 489.2088 0.127981 0.8995X2 134.1557 232.9303 0.575948 0.5714X3 1.886588 0.600027 3.144175 0.0053X4 -1.596394 0.701018 -2.277251 0.0345R-squared 0.689658 Mean dependent var 945.2913Adjusted R-squared 0.640657 S.D. dependent var 224.1711S.E. of regression 134.3798 Akaike info criterion 12.79599Sum squared resid 343100.8 Schwarz criterion 12.99347Log likelihood -143.1539 F-statistic 14.07429Durbin-Watson stat 2.143110 Prob(F-statistic) 0.000046由输出结果可以看出,在 的水平下,解释变量 、 的检验的P值都大于0.05,解释变量不能通过显著性检验,因此可以得出结论模型中只能引入X3、X4两个变量。则调整后的多元线性回归方程为:Se= (142.5882) (0.553402) (0.656624)T= (2.326290) (3.192782) (-2.244390)F=21.66965 df=20(三).异方差性的检验对模型 进行怀特检验:White Heteroskedasticity Test:F-statistic 1.071659 Probability 0.399378Obs*R-squared 4.423847 Probability 0.351673Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 12/11/07 Time: 16:53Sample: 1 23Included observations: 23Variable Coefficient Std. Error t-Statistic Prob.C 34247.50 128527.9 0.266460 0.7929X3 247.9623 628.1924 0.394723 0.6977X3^2 -0.071268 0.187278 -0.380548 0.7080X4 -333.6779 714.3390 -0.467114 0.6460X4^2 0.121138 0.229933 0.526841 0.6047R-squared 0.192341 Mean dependent var 15177.87Adjusted R-squared 0.012861 S.D. dependent var 23242.54S.E. of regression 23092.59 Akaike info criterion 23.12207Sum squared resid 9.60E+09 Schwarz criterion 23.36892Log likelihood -260.9038 F-statistic 1.071659Durbin-Watson stat 1.968939 Prob(F-statistic) 0.399378由检验结果可知, ,由White检验知,在 时,查 分布表,得临界值 (20)=30.1435,因为 < (5)= 30.1435,所以模型中不存在异方差。(四).自相关的检验由模型的输出结果可知,估计结果都比较满意,无论是回归方程检验,还是参数显著性检验的检验概率,都显著小于0.05,D-W值为2.111635,显著性水平 =0.05下查Durbin-Watson表,其中n=23,解释变量的个数为2,得到下限临界值 ,上限临界值 , =1.543
179 浏览 3 回答
232 浏览 7 回答
237 浏览 2 回答
233 浏览 3 回答
291 浏览 3 回答
141 浏览 3 回答
175 浏览 2 回答
303 浏览 3 回答
122 浏览 2 回答
319 浏览 3 回答
334 浏览 3 回答
328 浏览 5 回答
213 浏览 4 回答
241 浏览 6 回答
163 浏览 5 回答