您当前的位置:首页 > 发表论文>论文发表

统计学与spss论文

2023-12-06 21:12 来源:学术参考网 作者:未知

统计学与spss论文

SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!

统计分析软件SPSS的特点和应用分析

【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。

【关键词】统计分析软件;SPSS;独立样本;非参数检验

一、前言

统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。

二、SPSS软件的特点

(一)操作简便

SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

(二)编程方便

具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。

(三)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

(四)全面的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。

(五)灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

(六)针对性强

SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。

三、实例分析――两个独立样本的检验(Test for Two Independent Sample)

例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:

甲(斤):9.31、9.57、10.21、8.86、8.52、10.53、9.21、9.14

乙(斤):9.98、8.46、8.92、10.14、10.17、11.04、9.43

问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?

解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;

H1:甲乙两地的西瓜重量有没有显著差异。

然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:

第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。

第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):

第三步:在Test Type栏中,确定检验方法。

SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。

第四步:选择输出的结果形式及缺失值处理方式;

第五步:单击OK,得输出结果。

所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。

参考文献

[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.

[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).

[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).

试谈SPSS软件在考试数据统计分析中的应用

摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。

关键词: SPSS软件 考试数据 统计分析 操作步骤

1. 引言

一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。

2. SPSS分析软件简介

“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。

3. 相关性分析

教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。

Pearson相关系数法计算公式:

式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。

Spearman相关系数法计算公式:

r=1-(2)

式中D为两个变量的秩序之差,n为样本容量。

Cronbach a信度系数法计算公式:

α= 1-(3)

式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。

对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。

数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。

我们以SPSS 13.0版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):

(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。

(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。

(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。

(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:

上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。

Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:

(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。

(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。

(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。

4. 选择题的选项分析

在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。

教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。

我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。

本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文

我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。

检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。

数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。

SPSS数据统计分析的步骤如下:

(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。

(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。

(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。

(4)点击【OK】,输出软件运算结果。

我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。

假设检验的显著性水平为α=0.05,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=0.0626,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在0.05显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。

5. 结语

SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。

参考文献:

[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.

[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.

[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.

[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.

猜你喜欢:

1. 统计学数据分析论文

2. spss统计分析实习心得

3. 统计学学年论文

4. 统计学分析论文

spss数据分析论文详细步骤

SPSS软件主要用于对数据做统计学方面的一些分析和检验,是用于对数据进行一些基本处理、分析,以及做一些统计检验的软件,使用SPSS分析数据通常有以下几步:导入数据——>数据基本处理——>数据分析——>总结并得出结论

打开SPSS后会出现两个界面,如下图;图一是数据处理分析区,包括数据视图(数据处理区)和变量视图(数据包含各字段编辑区);图二是分析结果区,分析的各类结果都会在此显示。导入数据:在数据处理区左上方选择“文件”——>“导入数据”,导入相应格式的数据,此处我以csv文件格式为例。点击之后,出现如下对话框,选择好要处理的数据,点击“打开”,对要导入数据数据按需要进行预处理,再点击确定。

求关于《SPSS统计分析与应用》的论文

楼主做完了吗,有答案吗

统计分析论文

统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!

浅谈统计分析与决策

[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。

[关键词] 统计分析 分析方法 决策

统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?

狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。

广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。

搞好统计分析,需要解决选题、分析、撰写报告三个问题。

一、统计分析选题

所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。

怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。

统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。

统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。

二、统计分析方法

统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。

统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。

统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。

形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。

对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。

所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,

没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。

从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。

三、统计分析报告的撰写

统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。

准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。

快:就是在决策层决策之前,不失时机地及时提供分析报告。

新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。

深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。

活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。

统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。

1.准确地表述事实

每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。

2.透彻地阐明本质

现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。

阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。

3.深刻地揭示规律

规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。

4.恰当地提出建议

认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。

以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。

统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。

试谈统计分析方法应用

【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。

【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言

随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。

二、多元统计分析方法的主要应用

统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。

聚类分析

它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。

判别分析

判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。

主成分分析

主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。

因子分析

因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。

三、构建多元统计分析方法检验体系的必要性

(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量

多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。

(二)多元统计分析统计检验体系的基础理论

多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。

(三)关于统计检验体系

将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:

a.主成分分析统计检验体系

b.因子分析统计检验体裂引

c.系统聚类分析统计检验体系

d.判别分析统计检验体裂

e.对应分析统计检验体系

f.典型相关分析统计检验体系

四、多元统计分析方法应用中需要注意的几个共性问题

1.关于原始数据变量的总体分布问题。

对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。

样本容量问题。

进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。

原始变量之间的相关性以及非线性关系问题。

多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。

数据处理问题。

多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。

五、结束语

在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。

【参考文献】

[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.

[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.

[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.

[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.

我需要SPSS统计分析实例,是要写500字左右论文的

运用逐步回归法
分析影响上海银行存款的因素

1.目的和意义
在现代商品经济社会中,人们的工作与生活已经离不开货币。在生活中人们所需的各种商品,都需要用货币去购买;人们所需的各种服务,也需要支付货币来获得;人们劳动工作的所获得的报酬——工资,也是用货币支付的;人们为了种种目的,要积累财富,保存财富,采用的主要方式是积攒货币、到银行储蓄。除个人外,企业、行政事业部门的日常运行同样也离不开货币。财政收支也都是用货币进行的。可见,货币已经融入了并影响这经济运行和人们的生活。作为经营“货币”这种商品的银行的功能是办理各种存款(也称为负债业务)、放款和汇兑业务,其中商业银行所吸收的各种存款(活期、定期、储蓄)约占银行资金来源的70%~80%,为银行提供了绝大部分的资金来源,并为实现银行各职能活动提供了基础。所以说,银行存款对银行本身的生存和发展有着重要意义,除此之外,银行存款也能反映出一个特定时期人们的生活水平以及经济发展的水平。因此对上海的银行存款的分析是非常重要且必要的。本文将介绍运用SPSS11.5统计分析软件中的逐步回归法对影响上海银行存款的因素进行分析研究并建立模型,为相关专业人士的决策提供一定参考。

2.影响银行存款的因素分析
存款作为银行吸收资金来源的主要业务,其之影响因素非常的多。从中我选取了10个主要因素的(1951年至2000年)数据运用SPSS的逐步回归法分析和研究它们对上海银行存款的影响程度。这10个因素分别是全市居民储蓄(亿元)、从业人数(万人)、全市居民消费水平(元/人)、全市银行贷款(亿元)、全社会固定资产投资总额(亿元)、职工工资总额(亿元)、职工劳保福利费用(万元)、社会消费品零售总额(亿元)、外贸出口商品总额(亿美元)、全市财政收入(亿元)。上海全市银行存款及影响其的10个因素的1951年至2000年的数据见下表2.1。

表2.1上海全市银行存款数据(1951年~2000年)
年份 全市银行存款(亿元) 全市居民储蓄(亿元) 从业人数(万人) 全市居民消费水平(元/人) 全市银行贷款(亿元) 全社会固定资产投资总额(亿元) 职工工资总额(亿元) 职工劳保福利费用(万元) 社会消费品零售总额(亿元) 全市财政收入(亿元) 外贸出口商品总额(亿美元)
1964 33.29 8.64 438.31 270 45.27 7.22 19.40 33117 26.55 73.35 6.52
1965 37.66 9.98 460.76 276 49.77 7.75 20.07 33819 27.13 83.18 7.65
1966 40.18 10.68 462.62 298 62.52 7.23 19.74 34536 28.72 92.49 8.74
1967 43.58 10.60 478.39 300 71.82 4.61 20.22 35268 30.78 73.97 8.42
1968 50.25 10.56 516.44 293 85.32 4.58 19.75 36016 29.94 83.98 8.49
1969 57.42 10.18 536.70 309 82.12 7.45 21.06 36780 32.57 102.30 8.76
1970 142.41 10.47 540.87 304 76.05 10.90 20.63 37560 31.85 114.02 8.67
1971 155.28 11.29 560.29 318 88.74 11.36 21.14 38356 32.91 123.53 9.81
1972 167.81 12.51 576.74 334 99.41 13.23 22.08 39169 36.15 129.11 13.30
1973 175.86 13.13 589.52 357 112.66 16.24 22.37 39999 39.79 138.18 23.16
1974 178.21 13.85 610.16 380 125.13 22.43 22.80 40847 44.06 143.04 24.39
1975 185.09 14.66 646.88 397 129.61 32.53 23.49 41737 47.71 147.11 22.20
1976 182.60 15.37 669.56 408 133.97 23.96 24.79 46531 49.98 144.42 19.78
1977 205.30 16.00 679.65 411 143.19 18.00 24.97 49797 49.28 159.91 22.21
1978 242.93 18.18 698.32 442 153.37 27.91 28.12 57424 54.10 190.67 28.93
1979 267.92 24.88 712.59 527 165.16 35.58 32.73 81664 68.28 192.75 36.75
1980 291.06 30.20 730.77 582 200.98 45.43 38.10 94004 80.43 198.85 42.66
1981 148.85 32.92 750.22 638 221.98 54.60 39.59 102061 88.73 204.52 38.07
1982 170.56 37.94 764.03 640 227.77 71.34 41.34 113909 89.80 200.69 36.05
1983 190.73 45.97 768.90 688 239.50 75.95 42.91 127679 100.68 204.34 36.48
1984 222.51 56.10 769.79 789 245.35 91.72 53.72 152282 123.72 215.79 35.87
1985 261.09 70.09 775.53 1030 306.27 118.56 68.99 190217 173.39 263.86 33.61
1986 324.81 90.95 782.99 1190 427.66 146.93 83.35 233574 196.84 257.72 35.82
1987 396.38 120.33 788.12 1298 523.35 186.30 94.78 286323 225.25 241.36 41.60
1988 419.68 141.21 792.13 1680 576.11 245.27 114.47 391974 295.83 261.69 46.05
1989 473.73 193.47 784.96 1928 698.71 214.76 131.10 437789 331.38 297.25 50.32
1990 613.86 252.16 787.72 2009 857.76 227.08 146.78 533797 333.86 284.36 53.21
1991 769.95 328.22 798.13 2421 1008.82 258.30 172.84 670676 382.06 324.66 57.40
1992 1051.45 413.09 806.91 2842 1213.32 357.38 217.21 804903 464.82 340.13 65.55
1993 1495.06 578.39 787.25 4162 1605.57 653.91 279.33 1038701 624.30 439.53 73.82
1994 2247.56 975.95 786.04 5343 1966.96 1123.29 357.89 1241344 770.74 615.91 90.77
1995 3056.76 1396.13 794.19 6712 2387.33 1601.79 440.75 1496034 970.04 702.46 115.77
1996 3870.98 1868.34 851.21 7742 2852.66 1952.05 492.70 .30 873.76 132.38
1997 5560.65 2729.57 847.25 8699 3722.30 1977.59 510.10 .21 1070.95 147.24
1998 5595.43 2372.94 836.21 9202 4259.71 1964.83 510.35 .03 1146.00 159.56
1999 6270.91 2597.12 812.09 10328 4862.03 1856.72 583.54 2095239 1590.38 1390.58 187.85
2000 6925.99 2524.05 828.35 11546 5415.71 2015.76 614.53 2521553 1722.27 1752.70 253.54
注:该表数据来源:《上海统计年鉴》

2.1全市居民储蓄(亿元)
个人货币收入是用来供个人消费的,积蓄是准备用作远期消费或不可预测的需要,它们都不是资本,金额也比较小。由于现代银行制度的发展,举办储蓄,并支付利息,小额的货币收入就可以转化为资本,从而扩大了社会资本总量,加速经济的发展。由表2.1可看到,随着社会经济的发展和人们收入的不断提高,全市居民储蓄从1951年的1.01亿元增加至2000年的2524.05亿元,特别是1985年之后呈快速增长趋势。可见社会公众的储蓄增长会提高银行盈利资产的规模,一定程度上使商业银行获得更多的收益。所以,全市居民储蓄对银行存款有着直接而深远的影响。

2.2从业人数(万人)
从业人数是指在全市各行各业的企事业单位中从事工作人数的总和,其包括了国有、集体、合资、独资等其他单位的从业人员,城镇个体劳动者,农村集体和个体劳动者以及其他劳动者。从表2.1可知,从业人数是呈稳定增长趋势的,这与全市人口的增加有着极大的关系。上海近十几年经济的飞速发展和国际大都市的形象,吸引了大批的外来人口(外地和外国)来沪居住、创业以及工作。随着全市企业数量的不断增加,从业人数也在不断的增加。从业人数的多少与银行存款有着紧密的联系,因为每个从业人员都会有自己的收入,不管收入的多与寡,他们每个人都会在银行拥有一个以上的帐户并利用存折、借计卡来取工资或办理各种活期、定期的储蓄或取款;利用信用卡刷卡消费或提款。

2.3全市居民消费水平(元/人)
居民消费水平是指居民在物质产品和劳务的消费过程中,对满足人们生存、发展和享受需要方面所达到的程度。通过消费的物质产品和劳务的数量和质量反映出来。反映居民消费水平的主要指标有:
(1)平均实物消费量指标:平均每人全年主要有消费品的消费量、平均每百户耐用消费品拥有量、人均居住面积、平均每人生活用水量、平均每人生活用电量等;
(2)现代化生活设施的普及程度指标:自来水普及率、煤气普及率、平均每百户主要家用电器拥有量、电话普及率等;
(3)反映消费水平的消费结构指标:居民生活消费支出中食品的比例、居民生活消费支出中文化生活服务支出比例、不同质量消费品的消费比例等;
(4)平均消费量的价值指标:平均每人消费基金、平均每人生活消费额、平均每人用于各项生活消费的支出等。
从表2.1中可以看到1990年以后的居民消费水平有了大大的提升,可见人们的生活质量随着改革开放的步伐的加快也越来越好。

2.4全市银行贷款(亿元)
贷款,又称放款,是银行将其所吸收的资金,按一定的利率贷给客户并约定归还期限的业务。虽然银行运用资金的方式不止贷款一种,但是贷款是商业银行在其资产业务中的比重一般占首位。通过贷款联系,银行可密切与工商企业往来联系,有利于拓宽业务领域,获得更多的利润。银行贷款的种类按不同的标注至少又以下几类:按期限分为短期贷款、中期贷款和长期贷款;按用途可分为投资贷款、商业贷款、消费贷款和农业贷款;按贷款是否有抵押品分为:抵押贷款和无抵押贷款;按换款的方式分为:一次偿还贷款和分期偿还贷款。从表2.1可知,银行贷款不断的大幅度增加,表明了经济的快速发展和人们消费理念的变化。

2.5全社会固定资产投资总额(亿元)
固定资产投资总额是以货币表现的建造和购置固定资产活动的工作量,它是反映固定资产投资规模、速度、比例关系和使用方向的综合性指标。全社会固定资产投资包括基本建设投资、更新改造投资、国有单位其他固定资产投资、房地产开发投资、城镇集体固定资产投资、联营经济、股份制经济、外商投资经济、港澳台投资经济及其他经济类型的固定资产投资,农村集体5万元以上固定资产投资,城镇工矿区私人建房投资和国防、人防基本建设投资。
全社会固定资产投资按经济类型可分为国有、集体、个体、联营、股份制、外商、港澳台商、其他等。按照管理渠道,全社会固定资产投资总额分为基本建设、更新改造、房地产开发投资和其他固定资产投资四个部分。
是社会固定资产再生产的主要手段。通过建造和购置固定资产的活动,国民经济不断采用先进技术装备,建立新兴部门,进一步调整经济结构和生产力的地区分布,增强经济实力,为改善人民物质文化生活创造物质条件。这对我国的社会主义现代化建设具有重要意义。
从表2.1可知,固定资产投资的总额是呈不固定态势来增长的,2000年的固定资产投资总额比1900年的增长8.8倍,非常真实地反映了上海在上世纪90年代经济的腾飞。

2.6职工工资总额(亿元)
职工工资总额是指各单位在一定时期内直接支付给本单位全部职工的劳动报酬的总和,包括奖金、津贴、补贴、加班工资和其他工资(附加工资、保留工资以及调整工资补发的上年工资等)。职工工资从某种程度上来说是市民收入的主要来源。而收入比较高的话,居民用于消费和储蓄的金额也会有相应的提高,所以职工工资直接影响着银行存款。

2.7职工劳保福利费用(万元)
劳保福利是指劳动保险和福利。为了保护工人职工的健康,减轻其生活中的困难,我国对劳动保险制定了相应的法律条文。福利指员工与工人福利之总称,亦指以企业员工为对象而实施的福利措施,包括法定的福利,企业主与工会所实施的提高职工生活水准的各种措施。由表2.1可知,2000年,单位支付职工劳保福利费用的总额已经达到2521553万元,并且其比例每年以3%~8%的速度增长,已高达67.9%,这一数据说明人们的基本生活标准可以得到保障,从而有更多的钱用于其它的消费和用于储蓄存款或其他金融投资。

2.8社会消费品零售总额(亿元)
社会消费品零售总额是指各种经济类型的批发零售贸易业、餐饮业、制造业和其他行业对城乡居民和社会集团的消费品零售额和农民对非农业居民零售额的总和。包括售给城乡居民用于生活消费的商品(不包括住房)和售给机关、团体、部队、学校、企业、事业单位和城市街道居民委员会、农村村民委员会用公款购买的用作非生产、非经营使用的消费品。这个指标反映通过各种商品流通渠道向居民和社会集团供应生活消费品来满足他们生活需要的情况,是研究人民生活、社会消费品购买力、货币流通等问题的重要指标。

2.9全市财政收入(亿元)
财政既然要提供公共物品来满足公共需要,就要从国内总收入(GDI——与生产指标GDP相对应的收入指标)中集中一部分收入,从这个意义上来理解,财政收入是指一定量的货币收入,即国家占有的以货币表现的一定量的国内总收入;财政收入又可以理解为一个分配过程,这一过程是财政运行的第一个阶段或第一个环节,在其中形成特定的分配关系或利益关系。财政收入按其形式分为税收、收费、债务收入、铸币税和通货膨胀税。财政运行是国民经济的运行的一个部分,国民经济的运行决定了财政的运行,而财政的运行也反过来影响国民经济的运行,直接影响投资、消费和进出口,影响GDP的增长和结构,影响收入分配和各阶层之间的收入差距,影响经济的稳定和可持续发展。

2.10外贸出口商品总额(亿美元)
对外出口贸易一直以来是上海经济发展的重要环节及体现,也是赚取外汇,达到国际收支平衡和增加国际储备的前提条件。随着中国加入WTO,上海的对外贸易也越来越频繁且出口的商品数量和金额也大大的提高。目前国际货物买卖合同中买卖双方就支付条款的订立大多都通过银行采用现汇结算的方式。在国际货物买卖中使用的结算工具主要是货币和票据,而银行作为买卖双方的结算中介为其办理汇兑业务、信用证业务、承兑业务。前两者是银行存款业务衍生出来的结算业务,而承兑业务是以银行的信用来确保客户的信用。到2000年底,一般贸易出口增幅继续高于加工贸易,而出口产品结构调整也随之加快,高新技术产品和机电产品出口快速增长。

3.回归方法与模型建立
3.1研究方法与原理
运用多元线性逐步回归方法研究预测影响上海的银行存款的因素。逐步回归是按自变量对因变量的作用程度从大到小逐个引入回归方程,每引入一个变量同时检验方程中各个自变量的显著性,合格保留、不显著剔除,反复进行直到再没有显著的变量可以引入为止。回归分析是根据自变量的最有组合建立回归方程(模型)预测因变量的未来发展趋势。
该方法的运用条件是有大量的观测统计数据,适用研究没有确定关系形式的因素对象,运用工具为SPSS统计软件。

3.2模型的建立及求解
因为银行存款与大部分变量呈指数关系,所以把表2.1的各个原始变量的50年数据进行对数变换(LN10()),并且把转换后的样本数据倒退8年后来建模。
设多元线性回归的模型为:
lnY=β0+β1X1+β2X2+β3X3+…+β9X9+β10X10
其中:
Y:全市银行存款(亿元)
X1 ——全市居民储蓄(亿元) X6 ——职工工资总额(亿元)
X2 ——从业人数(万人) X7 ——职工劳保福利费用(万元)
X3 ——全市居民消费水平(元/人) X8 ——社会消费品零售总额(亿元)
X4 ——全市银行贷款(亿元) X9 ——全市财政收入(亿元)
X5 ——全社会固定资产投资总额(亿元) X10 —— 外贸出口商品总额(亿美元)

注:模型中倒退的年数用(t-n)表示,其中n表示倒退几年。(t-n)不参与任何计算,它只做标识之用。
利用SPSS11.5对样本数据进行统计分析,运行后的输出的结果如表3.2.1所示。

表3.2.1 逐步回归统计分析结果 Coefficients
Model Unstandardized Coefficients Standardized Coefficients t Sig.
B Std. Error Beta
18 (Constant) -.994 1.012 -.982 .334
居储7 .692 .146 .595 4.741 .000
从人1 1.386 .604 .216 2.294 .029
固投6 -.285 .046 -.280 -6.246 .000
财政4 -.634 .146 -.289 -4.358 .000
银贷4 1.007 .100 .813 10.057 .000
劳福2 -1.396 .189 -1.221 -7.380 .000
工资1 1.053 .232 .754 4.531 .000
财政3 -.670 .134 -.311 -5.005 .000
从人8 -2.413 .336 -.485 -7.184 .000
从人2 2.954 .670 .479 4.406 .000
银贷2 .520 .110 .440 4.703 .000
劳福6 .418 .193 .305 2.168 .039

即回归模型为:
lnY=0.595X1(t-7) +0.216X2(t-1) -0.28X5(t-6) -0.289X9(t-4) +0.813X4(t-4) -
1.221X7(t-2) +0.754X6(t-1) -0.311X9(t-3) -0.485X2(t-8) +0.479X2(t-2) +
0.44X4(t-2) +0.305X7(t-6)
所以,在倒退8年的50年数据样本中,银行存款的增长与前7年的全市居民储蓄,前1年、前8年、前2年的从业人数,前6年的全社会固定资产投资总额,前4年和前3年的全市财政收入,前4年和前2年的银行贷款,前2年和前6年的职工劳保福利费用,前1年的职工工资总额等因素之间有显著意义的相关关系。

4.结论和评价
4.1模型评价
4.1.1进入因素的分析

表4.1.1.1 Variables Entered/Removed(a)

Model Variables Entered Variables Removed Method
1 居储7 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).
2 工资7 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).
3 固投8 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).
4 从人1 . Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).
5 . 工资7 Stepwise (Criteria: Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100).
由于SPSS11.5软件通过特定程序对上海市相关数据进行整体的统计运算,所以具有更强的客观性和公证性。从上表中可以看出,按自变量对因变量的作用程度从大到小首先引入的是前7年的居民储蓄,等到第五步时把之前进入的前7年的职工工资给剔除了,再后面的第14和第17步中把前8年的固定投资和前3年的银行贷款给剔除了。这3个被剔除的变量在引入变量越来越多的情况下被检验出其显著性不合格。除此之外,在10个自变量中,诸如全市居民消费水平、社会消费品零售总额、外贸出口商品总额没有进入模型。因为的外贸出口商品总额涨幅没有达到足以进入方程的显著性,所以被剔除了。不过,随着贸易全球化和中国国际地位的提高,上海的外贸出口总额也会不断的增加,在不久的将来会对银行存款起明显的作用。
我们可以从表3.2.1看到,在进入的因素中全社会固定资产投资总额、财政收入、前2年的职工劳保福利费用、前8年的从业人员与银行存款是负相关,即随着它们的增加加快,银行存款的增长会减慢,其中前2年的职工劳保福利费用影响最强,其系数为-1.221。前8年的从业人员、财政收入、全社会固定资产投资总额的影响顺次递减。比如说,全社会固定资产投资总额增加,表明了国有、集体、个体、联营、股份制、外商、港澳台商提供了对基本建设、更新改造、房地产开发投资和其他固定资产投资额,那么他们必须从银行拿出自己的存款,有时还需要向银行进行贷款来完成投资,所以银行的存款量会增加缓慢是可以想象的。又比如说财政收入,政府的财政收入是通过税收、收费等途径获得,如果国家对个人、企业所征取的税越多的话,个人与企业的支出就会增加,净收入也就变少了,而如果其用于消费的指出不变或提高的话,那么其用于银行存款的货币就会相应减少,从而导致全市银行存款的递增缓慢。
而居民储蓄、银行贷款、职工的工资、前1年和前2年的从业人员、前6年的职工劳保福利费用与银行存款呈正相关,即随着它们的增加加快,银行存款的增长也会加快,其中前四年的银行贷款的影响最强,其系数为0.813,其次是居民储蓄等等。比如说,职工工资的增加会使得人们的收入上升,收入上升后虽然有一部分会被用来支付消费,但绝大部分人们还是会把钱存入银行,用于各种类型的投资,这种行为使得银行存款的增加加快。又如:居民储蓄的增加,当然会直接影响银行存款量的增加,这是勿庸置疑的,因为居民储蓄是银行存款业务的主要内容,它是银行吸收资金的主要方式。再如:经济的发展会使得银行贷款量上升,银行想要通过贷款给个人或企业客户来获得更多利润,那么银行就会运用各种手段来增加吸引资金量。在这种情况下,社会上的闲置资金由于较高的收益而会流向银行,使得银行存款增加速度加快。

从表4.1.2.1中我们可以看到,随着进入的变量越多,F值由大变小,然后再由小变大,使得最后一步的F值达到1191.379,表明回归模型包括12个变量,且拟合度较高。

4.1.3自相关问题的诊断
DW值一般要求1.5~2.5时,残差与自变量互为独立。从表4.1.3.1可见回归模型的DW值为2.342,说明该模型无自相关的问题,此模型可以被使用。
表4.1.3.1 Model Summary(s)
Model R R Square Adjusted R Square Std. Error of the

4.1.4样本检验
表4.1.4.1
年份 取对数值(y1) 取对预测值(y2) 相对误差(%)
2001 3.93 4.05 3.05
2002 3.98 4.17 4.77
2003 4.09 4.32 5.62
以上的样本检验的相对误差的计算方法是用2001年~2003年各个取对预测值减去对应的取对数值之后再除以取对数值后得到的。其公式:
相对误差=(y2-y1)/y1×100%
样本检验的相对误差需不大于10%,表示所建立的模型是可以使用的。表4.1.4.1中的所计算的相对误差的都小于10%,说明模型建立的较好。

4.1.5残差正态性检验

图4.1.5.1 银行存款对数的标准化残差直方图
图4.1.5.1表明:标准化残差的正态曲线的均值为0,标准差为0.84,接近标准正态曲线,基本满足随机误差项正态分布的假设理论,模型拟合效果比较好。

4.1.6银行存款对数的正态概率图和残差散点图

图4.1.6.1 正态概率图

图4.1.6.2 散点图
图4.1.6.1表明:代表样本残差的数据点基本处在表示指定正态分布的直线上或周围,因此基本符合残差正态分布的假设理论。
图4.1.6.2表明:残差散点的分布随机均匀,且大多落在水平直线-2和2之间,所以可以判断残差与因变量之间相互独立性较高,基本满足残差独立的假设理论,模型的拟合效果比较好。

4.2结论
综上所述,商业银行的存款不断的增加,可以反映上海居民的收入在不断地增加、生活品质也在不断的提高,更可以从侧面反映上海金融的飞速发展和经济的繁荣。我国加入世贸组织后,金融对外开放程度加深,国内各银行之间、外资银行与中资银行之间的竞争越来越激烈,而存款是竞争的重要领域。随着我国国民物质生活的丰富,消费观念的变化,投资渠道的增多,这些因素将深刻地影响客户存款需求的特性。目前我国商业银行负债以存款为主,负债结构单一,缺乏稳定性;同时银行特别是国有商业银行由于历史和体制的原因,存在资产质量差,不良贷款率高,资本金不足等问题,使得我国银行业积聚了大量的风险。因此,我国商业银行的存款产品必须进行契约设计的改进,完善其中的激励与约束对等的机制设计,创新存款产品种类,满足不同客户的个性化需求;同时要提高存款的稳定性。上海作为全国的金融中心,应该顺应时代的进步建立一个合理的金融体系并完善其制度,而商业银行作为金融的重要环节应不断地对自身进行改革和创新更好地为个人和企业客户服务,这对于上海人民的生活水平的提高和经济的稳定发展具有重要的意义和作用。

参考文献
[2]黄达.金融学[M].北京:中国人民大学出版社,2004
[3]郑道平.货币银行学原理[M].北京:中国金融出版社,2005
[4]陈共.财政学[M].北京:中国人们大学出版社,2004
[6]彼得·K·奥本海姆,官青译.跨国银行业务[M].北京:中国计划出版社.2001
[6]上海统计年鉴.

相关文章
学术参考网 · 手机版
https://m.lw881.com/
首页