基于spss聚类分析的毕业论文

SPSS软件是“统计产品与服务解决方案”软件，是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的范文，欢迎大家阅读参考!

统计分析软件SPSS的特点和应用分析

【摘要】通过文献资料法，介绍了统计分析软件SPSS的特点，并通过实例：用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的应用做了详细的介绍，旨在为学习SPSS软件的人们提供参考。

【关键词】统计分析软件;SPSS;独立样本;非参数检验

一、前言

统计分析软件SPSS是一款统计产品与服务解决方案的软件，其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件，目前在各专业毕业论文经常可以看到它的身影，其应用范围广、方便快捷等特点吸引着众多的爱好者。本文通过对统计分析软件SPSS的功特点进行介绍，通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的操作用做了详细的介绍，为学习SPSS软件的人们提供参考。

二、SPSS软件的特点

(一)操作简便

SPSS软件的界面非常友好，除了数据录入及部分命令程序等少数输入工作需要键盘键入外，大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。

(二)编程方便

具有第四代语言的特点，告诉系统要做什么，无需告诉怎样做。只要了解统计分析的原理，无需通晓统计方法的各种算法，即可得到需要的统计分析结果。对于常见的统计方法，SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此，用户无需花大量时间记忆大量的命令、过程、选择项。

(三)功能强大

具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法，比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

(四)全面的数据接口

能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件，文本编辑器软件生成的ASCⅡ数据文件， Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt，word，PPT及html格式的文件。

(五)灵活的功能模块组合

SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。

(六)针对性强

SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析，大多青睐于SPSS，像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS，因为他们可以通过编程来实现更强大的功能。

三、实例分析――两个独立样本的检验(Test for Two Independent Sample)

例题：为了调查甲、乙两地土壤对种植同一种西瓜有没有影响，从这两个产地分别随机抽取同种的8只和7只西瓜，称重后得重量(市斤)如下：

甲(斤)：、、、、、、、

乙(斤)：、、、、、、

问：根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?

解：建立假设 H0：甲乙两地的西瓜重量没有显著差异;

H1：甲乙两地的西瓜重量有没有显著差异。

然后根据上面给出的数据建立数据文件，注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具体操作过程如下：

第一步：单击Analyze Nonparametric Test 2 Independent Sample，打开Two-Independent-Sample对话框(见图1)。

第二步：选择检验的变量进入检验框中，选择分组变量进入Grouping Variable框中，单击Define Group键，打开Define Group对话框，将分组变量值分别键入两个框中，单击Continue返回主对话框(见图2)：

第三步：在Test Type栏中，确定检验方法。

SPSS中提供了四种检验方式，几种检验方法侧重点不同，但都是先把两样本数据混合排序，再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样，所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。

第四步：选择输出的结果形式及缺失值处理方式;

第五步：单击OK，得输出结果。

所以，以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。

参考文献

[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.

[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).

[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).

试谈SPSS软件在考试数据统计分析中的应用

摘要： SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤，文中的方法对考试研究人员具有一定的指导意义。

关键词： SPSS软件考试数据统计分析操作步骤

1. 引言

一份好的试卷须有好的测量指标来表明它的优良程度，试题有难度和区分度指标，试卷有效度和信度指标，这些是评价考试最主要的测量指标，但是仅有这些指标不足以反映一份试卷的实际测量效果，考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代，考试成绩统计主要依靠人工阅卷，考试数据无法电子化存储，对考试数据分析统计难以实现。随着计算机的普及和信息化的推广，各种分析数据的软件应运而生，这些软件中汇集了统计学和测量学的分析工具，使得应用电子信息技术分析统计考试成绩数据成为可能，这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中，SPSS是应用最多、影响最广泛的分析工具之一。在本文中，我们以SPSS软件为工具，对教育招生考试成绩的数据进行统计分析，分析主要着重于考试数据的相关性、假设检验等几个方面。

2. SPSS分析软件简介

“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”，中文名称为“社会科学统计软件包”，它是世界著名的统计分析软件之一，在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包，它集数据整理、分析于一身，主要功能包括数据管理、统计分析、图表分析、输出管理等，该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。

下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析，介绍使用SPSS进行统计分析的一般方法和步骤。

3. 相关性分析

教育考试中，考试结果的信度，试题的区分度，每个题目得分与试卷总分的关系，以及题目之间的关系，等等，都是考试研究的重要内容，最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中，Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。

Pearson相关系数法计算公式：

式中x为第i个考生第j题的得分，y为第i个考生第k题的得分，为第j题的平均分，为第k题的平均分，n为测试样本量。该公式既可以计算两个连续变量之间的相关性，又可以计算一个双歧变量与一个连续变量之间的相关性。

Spearman相关系数法计算公式：

r=1-(2)

式中D为两个变量的秩序之差，n为样本容量。

Cronbach a信度系数法计算公式：

α= 1-(3)

式中n为试题数，s为第i题的标准差，s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。

对于给定的一组考生成绩数据，利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性，以及各个题目之间的相关性。我们以Pearson相关系数分析为例，利用SPSS软件进行统计分析。

数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷)，数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。

我们以SPSS 版本的软件为例，介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例)：

(1)将考试数据导入SPSS软件，在SPSS数据窗口中，顺序点击【Analyze】→【Correlate】→【Bivariate...】，系统弹出变量相关系数设置对话框。

(2)在该对话框中，将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中，在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中，选取“Pearson”复选框。

(3)在该对话框的“Test of Significance”设置区域，可以点选“Two-tailed”选项或者“One-tailed”，我们采用系统默认值。

(4)对话框中的其它选项取软件系统的默认值，点击【OK】，开始相关系数计算，系统弹出新的窗体输出运算的结果。本次输出的情况如下：

上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中，但题目T4和题目T5之间的相关程度远高于其它几个题目，我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系，这是我们通过分析获取的重要信息，该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性，这在大规模考试中是不应该出现的，需要在以后的命题考试中加以改进。

Spearman相关系数分析方法和上述分析方法类似，只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框，程序就会按Pearson相关系数法进行统计分析，如果同时选中“Spearman”和“Pearson”复选框，程序将会同时计算按两种分析方法统计分析的数据，并会以不同的图表进行显示，而Cronbach a信度系数法计算方法与上述方法略有不同，其操作步骤如下：

(1)在SPSS数据窗口中，顺序点击【Analyze】→【Scale】→【Reliability Analysis...】，系统弹出“Reliability Analysis”信度分析设置对话框。

(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中，在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数)，点击“Statistics”选择项可以进行更为详细的参数设置，我们采用系统的默认值即可。

(3)参数设置完毕之后，点击【OK】，软件开始相关系数计算并输出运算结果。

4. 选择题的选项分析

在目前的教育招生考试中选择题是一种较常见的题型，考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2]，对选择题干扰项的设计及其施测后的实际效果关注甚少，事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设，对试卷中常见的选择题选择项进行统计分析。

教育考试的单项选择项一般设置为4个，其中仅有1个选择项是正确的。命题人员在设计选择项时，应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测，对考生作答的分布情况作出预估。考试结束后，研究人员应该对实测的情况与命题教师预测的情况进行对比分析，以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性，因此可以尝试使用χ检验假设进行分析。

我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理，设变量E是命题者对某道试题的期望值，E=nP，n为样本容量，P为期望的相对频率，引入以下统计量：∑(O-E)/E，其中O为观察频数。

本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文

我们需要进行的假设检验是：零假设H：选项的实测分布与期望分布相同;非零假设H：选项的实测分布与期望分布不同。

检验假设的思想：拟合度检验的统计量在确定的某种显著性水平下如果零假设是真，则检验统计量∑(O-E)/E呈近似χ分布，其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合，就不排除零假设，否则就排除零假设;最后对检验假设的结果进行解释。

数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本，利用SPSS进行统计分析。

SPSS数据统计分析的步骤如下：

(1)将考试数据导入SPSS软件，依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】，弹出“Chi-Square Tests”对话框。

(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中，本例中题目的序号为t7。

(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框，具体操作方法是选中单选框“Values”，输入具体的期望数值，点击“Add”按钮，依次重复上述的步骤直至所有的选项的期望值输入完毕。

(4)点击【OK】，输出软件运算结果。

我们需要进行的假设检验，H：选项的实测分布与期望分布相同;H：选项的实测分布与期望分布不同。

假设检验的显著性水平为α=，χ=∑(O-E)/E，自由度为df=4-1=3，查χ分布表或利用相关软件可得P=，由于P>α，因此不能拒绝零假设，即选项的实测分布与期望分布相同。因此，检验结果在显著性水平时，没有足够的证据拒绝零假设，即可认为本题选项的实测分布与期望分布相同，也就是说本题的实际测试效果与命题教师预测的效果是一致的，命题教师准确地估计了考生的实际水平，这是分析获得的很重要的结论。

5. 结语

SPSS软件在考试数据统计分析中应用广泛，但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面，本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看，软件操作步骤和统计分析过程十分简单、快捷，对于测量学和统计学基础不太好的数据分析统计人员来说，只要遵循一定的操作步骤，就可以进行分析。

参考文献：

[1]王孝玲.教育测量(修订版)[M].上海：华东师范大学出版社，2006.

[2]雷新勇.大规模教育考试：命题与评价[M].上海：华东师范大学出版社，2006.

[3]李伟明，冯伯麟，余仁胜.考试的统计分析方法[M].北京：高等教育出版社，1990.

[4]雷新勇.考试数据的统计分析和解释[M].上海：华东师范大学出版社，2007.

关于聚类分析的毕业论文

基于聚类分析的广西区域经济发展状况研究的论文

【摘要】：本文以广西壮族自治区14个地级市作为研究对象，从地区生产总值、社会消费品零售总额、全社会固定资产投资、公共财政预算收支总额等方面，选取11个具体指标，运用聚类分析方法分析并评价各地级市经济发展状况。研究结果显示，广西14个地级市可划分为四类经济区域，不同城市之间的经济发展水平存在较大差异。在此基础上，从加强各地级市之间的经济合作、积极推动开放型经济发展、强化科技创新以推动产业结构优化升级等方面提出具体建议，为促进广西区域经济的全面发展提供参考。

【关键词】：聚类分析；广西；经济发展；政策建议

一、引言

近年来，随着中国—东盟自由贸易区的建成，中国与东盟各国贸易投资增长，经济融合加深，经贸往来愈加频繁。广西作为中国—东盟自由贸易区的门户省份，加之“一带一路”战略的提出与实施，良好的区位优势和资源环境承载能力，无疑将会为推动广西区域经济的腾飞提供持续的动力和良好的机遇，发展前景十分广阔。但由于历史的原因，加上人口、社会和基础设施等因素的影响，广西的经济发展水平和人均地区生产总值在内陆31个省、市、自治区中仍处于中下水平，与上述提到拥有的区位优势、经济优势是极不相称的。广西下辖的14个地级市经济发展程度和产业结构也存在一定的差异。一直以来，区域经济发展问题都是区域经济学、经济地理学等学科关注和研究的对象，区域经济发展中出现差距，是各国经济发展中存在的普遍现象[1]。如何就广西下辖的14个地级市进行经济发展程度的分析和分类，对于正确认识广西各地级市经济发展所处的发展阶段，制定正确的宏观政策，以促进各地区的良好协调发展具有重要的理论和现实意义。

二、研究区域概况

广西壮族自治区，简称“桂”，首府南宁，位于中国华南地区西部，与广东、湖南等省份接壤，南濒北部湾，面向东南亚，是中国唯一一个沿海自治区，自然条件优越，资源丰富，尤以海洋资源和矿产资源为甚。截至2015年12月，全区辖14个地级市，县级行政区111个，行政区划面积万平方公里。2015年全区总人口为5518万人，地区生产总值亿元，占全国的。人均地区生产总值为39150元。但由于历史的原因，加上人口、社会和基础设施等因素的影响，广西的经济发展水平，无论是地区生产总值还是三大产业结构完善程度等方面，在内陆31个省市中均处于中下水平。区内下辖的14个地级市，经济发展水平和产业结构各异，部分地级市经济发展程度相对滞后。近年来，随着中国—东盟自由贸易区的建成和“一带一路”战略的实施，广西吸引着国内外大量的资本和人力涌入，显现出广阔的发展前景。

三、聚类分析方法研究设计

（一）指标选择及数据来源

区域经济发展状况的研究，依靠单一的指标，是无法对其进行综合、全面的评价与分析的。因此，在对广西区域经济发展水平分析评价的过程中，需要借助多个评价指标，构建合理完善的评价指标体系。本着建立评价指标体系要遵循科学性、系统性、全面性、独立性、可操作性等原则，本文在参考以往文献资料的基础上，根据广西各地级市经济发展状况、人口条件、社会资源等方面的实际情况选取了11个具体指标，分别是：行政区划土地面积（平方公里）、地区生产总值（亿元）、人均地区生产总值（元）、户籍年末总人口（万人）、固定资产投资（亿元，不含农户）、公共财政预算收入（亿元）、公共财政预算支出（亿元）、农民居民人均纯收入（元）、城镇居民人均可支配收入（元）、社会消费品零售总额（亿元）、进出口总额（人民币，万元）。为方便后续各指标数据的处理，分别以X1、X2、X3、X4、X5、X6、X7、X8、X9、X10和X11指代。各指标详细数据均来自《广西统计年鉴2016》和《2015年广西壮族自治区国民经济与社会发展统计公报》。

（二）数据处理

本文利用对反映广西14个地级市经济发展状况的指标进行聚类分析。由上述内容可知，研究所选取的11个指标由于它们原始数据量刚的不同，为防止指标取值的分散程度较大，需对各指标的取值做标准化处理。

各指标数据经过标准化处理后，X2（地区生产总值）与X5（固定资产投资）、X6（公共财政预算收入）、X10（社会消费品零售总额）的相关系数都大于，故而这四个指标不必均作为聚类变量，选择其中一个即可，本文选择X2（地区生产总值）。接着，运用不同的聚类方法进行聚类分析。

（三）结果分析

本文利用对广西14个地级市经济发展状况进行聚类分析，在对选定的11个聚类变量的数据经过标准化处理后，依据结果聚类个数的不同，而相继运用系统聚类和K—均值聚类法进行聚类分析，并得出结果。参考以往文献资料对广西14个地级市经济发展状况的分类，以及广西各地区实际的经济、社会和人口状况，本文认为对广西14个地级市经济发展水平的分类，聚类个数分为四类比较适宜。对于广西14个地级市经济发展水平的分类应为：南宁、北海、钦州为第一类；柳州、桂林、梧州、贵港、玉林、百色、贺州、河池、来宾为第二类；防城港为第三类；崇左为第四类。

由聚类分析结果可知，南宁、北海、钦州为第一类，这三个地级市经济相对发达。南宁是广西的首府，全区的政治、经济、文化、金融和信息中心，经济发展程度高，产业结构相对完整，良好的区位优势、众多的政策支持以及坚实的经济发展基础，使得南宁在多方面的发展都领跑于广西区的其他地级市。北海是全国14个沿海开放城市之一，处于泛北湾经济合作区域结合部的中心位置，便捷、高效的交通设施，众多经济圈的发展福利，以及丰富的海洋资源、繁荣的旅游业，都推动着北海经济社会的快速发展。钦州，南海之滨，北部湾经济区南的中心位置，是大西南最便捷的出海通道，依托于得天独厚的港口优势，大力发展进出口贸易。

柳州、桂林、梧州、贵港、玉林、百色、贺州、河池、来宾为第二类，这9个地级市经济发展水平较高，三大产业结构相对完善，各自依托于自身的经济发展优势，经济发展增速较快。

防城港和崇左分别是第三和第四类。防城港是中国的深水良港，是中国25个沿海主要港口之一，对外贸易额较高，在中国—东盟自由贸易区、泛北部湾区域合作中具有特殊重要的战略地位。崇左位于广西西南部，地理位置相对较差，工业基础薄弱，交通设施落后，虽然资源丰富，但限于人力资源的短板，是广西经济发展较为落后的地级市。

四、结论及政策建议

本文利用对广西14个地级市经济发展状况进行聚类分析，将广西14个地级市经济发展水平分为四类，分别是南宁、北海、钦州为第一类；柳州、桂林、梧州、贵港、玉林、百色、贺州、河池、来宾为第二类；防城港为第三类；崇左为第四类。从聚类分析的结果来看，就如何促进广西区域经济的快速、协调发展，可从以下几个方面着手：

（一）加强各地级市之间的经济合作，增强较发达地区的经济辐射力度

广西各地区经济发展水平差异显著，各自依托的经济发展要素也不尽相同，例如人力资本、环境资源、基础设施完善程度和地理位置等就相差较大。因此，各地区根据自身的条件优势，因地制宜地制定经济发展策略，就显得尤为重要。因地制宜地制定经济发展策略的同时，加强各地级市之间的经济合作，实现资源、信息的共享互通，人力、资金的自由流通，各自取长补短，将为促进各地区的快速、协调发展发挥重要作用。以南宁、桂林和柳州为主的老牌较发达地区，拥有较发达的工业基础、第三产业和相对完善的基础设施，在立足自身优势发展，加强与各地级市之间的经济合作中，要发挥好领头羊的作用，率先做出垂范，积极探索出可供借鉴的合作模式，增强对周边地级市的经济辐射力度，以少带多，以强扶弱，真正促进广西经济发展迈上新台阶。

（二）依托良好的区位优势和叠加的'政策优势，积极推动开放型经济发展

随着经济全球化和区域经济一体化的发展，我国经济和世界经济发展的融合在不断加深，积极推动外向型经济的发展，成为了我国及各地区经济转型升级的关键所在。2015年3月，国家发改委、外交部和商务部联合发布了《推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动》，广西借助于自身的区位优势，被纳入国家“一带一路”建设规划，发展开放型经济面临着重大的历史机遇。广西的外向型经济近些年来虽有发展，但整体情况仍不容乐观，相对薄弱的经济基础制约着开放型经济的发展后劲以及支撑开放型经济发展的高级要素也存在不足[2]。借助于“一带一路”战略实施的机遇和叠加密集的国家开发政策，依托沿海、沿江、沿边的区位优势，借鉴东部沿海典型的开放型经济发展模式，例如上海模式和东莞模式，积极推动广西的外向型经济发展，才能快速、协调地完成广西经济的转型升级。

（三）强化科技创新，加速推动产业结构优化升级

科技创新与产业结构优化升级是长期的协调关系，依托于科技创新能有效推动产业结构优化升级。一般来说，产业结构指的是一二三产业所占的比重，产业结构优化升级有两个含义：一个是产业结构合理化，另一个是产业结构高级化，如果第三产业所占的比重越大，那么可以说它的高级化程度越大[3]。未来一段时间，可以从以下几个方面强化科技创新，加速广西产业结构的转型升级：一是加强科技创新方面的改革，建立完善的科技管理协调机制和信息公开机制，优化科技资源配置机制，以统筹科技创新全方位管理；二是加大对科技创新的财政支持，保证各项用于科技创新的资金行使到位；三是优化科技创新体系，不仅要保证建立完善的科技创新管理机制，更要全面扩大科技创新的主体，落实科技创新成果的投入使用。

（四）完善各地区的基础设施建设，大力发展地区特色经济

广西各地区经济发展水平差异显著，相对发达的地区，例如南宁、柳州和桂林等，除主城经济区外，基础设施建设仍不尽完善。河池、百色、崇左等市地处偏远地区，交通不便，基础设施建设更是落后。良好的交通条件、便利的通讯设施、覆盖全面的水利、电力设施等是居民和企业的共同物质基础，更是物质生产和劳动力再生产的重要条件。因此，各地区应把完善基础设施建设放在重要位置，适当扩大社会固定资产投资总量，积极利用本地区丰富的人文资源，打好“侨牌”，让更多拥有广西籍的海外华人华侨参与到广西的经济建设之中，尽快完善基础设施建设，为经济的快速发展提供良好的基础。同时，各地区应找准自身的发展定位，结合地区优势，大力发展地区特色经济。

参考文献：

[1]孟倩.基于主成分分析和聚类分析的山东省区域经济协调发展研究[J].区域经济，2016（1）：138-139

[2]李继宏.“一带一路”建设背景下广西开放型经济发展模式及实现路径[J].广西社会科学，2016（4）：14-19

[3]徐晓慧.广西科技创新对产业结构升级的影响[J].合作经济与科技，2016（11）：19-21

聚类分析算法论文

聚类分析又称群分析，它是研究（样品或指标）分类问题的一种统计分析方法，同时也是数据挖掘的一个重要算法。下面是我分享给大家的聚类分析算法论文，欢迎阅读。

一、引言

聚类分析算法是给定m维空间R中的n个向量，把每个向量归属到k个聚类中的某一个，使得每一个向量与其聚类中心的距离最小。聚类可以理解为：类内的相关性尽量大，类间相关性尽量小。聚类问题作为一种无指导的学习问题，目的在于通过把原来的对象集合分成相似的组或簇，来获得某种内在的数据规律。聚类分析的基本思想是：采用多变量的统计值，定量地确定相互之间的亲疏关系，考虑对象多因素的联系和主导作用，按它们亲疏差异程度，归入不同的分类中一元，使分类更具客观实际并能反映事物的内在必然联系。也就是说，聚类分析是把研究对象视作多维空间中的许多点，并合理地分成若干类，因此它是一种根据变量域之间的相似性而逐步归群成类的方法，它能客观地反映这些变量或区域之间的内在组合关系。盐矿区系统是一个多层次、复杂的大系统,涉及诸多模糊、不确定的因素。平顶山市盐矿区的经济分类是以整个平顶山市的所有盐矿区为研究对象,以各盐矿区为基本单元,以经济为中心,以发展战略和合理布局为目标进行经济类型区划。其基本原则是：平顶山市的盐矿区资源开发、利用的相对一致性；自然、经济、社会条件的一致性；保持一定行政地域单元的相对稳定性。现行的平顶山市盐矿区行政划分不能反映出各个盐矿区的共同点,有必要通过模糊聚类分析将那些经济实际状况相似的铁矿区归类，剖析、发现各况矿区的差异,对症下药，为制定发展对策提供依据。

二、建立指标体系

1、确定分类指标进行经济区划分，应考虑的指标因素是多种多样的。既要以岩盐矿资源储量为主，又要适当考虑岩盐质量和勘察阶段和开发利用状况；既要有直接指标，又要有间接指标；既要考虑矿区发展的现状，又要考虑矿区发展的过程和矿区发展的未来方向。参考有关资料，结合专家意见，我们确定了对平顶山市盐矿区进行经济区划分的指标。如表1所示。表中列举了具体指标及各指标的原始数据（数据来源于河南省2006年矿产资源储量简表）。表1盐矿区经济划分指标体系及指标数据注：表中N表示缺失数据，勘察阶段1、2、3分别表示：初步勘探、详细普查、详细勘探，利用状况1~7分别表示：近期不宜进一步工作、可供进一步工作、近期难以利用、推荐近期利用、计划近期利用、基建矿区、开采矿区。

2、转换指标数据由于不同变量之间存在不同量纲由于不同变量之间存在不同量纲、不同数量级，为使各个变量更具有可比性，有必要对数据进行转换。目前进行数据处理的方法大致有三种，即标准化、极差标准化和正规化。为便于更直观的比较各市之间同一指标的数值大小，我们采用了正规化转换方式。其计算公式为:为了方便叙述，做如下设定：设Xi(i=1，2，3，…，21)为具体指标层中第i个评价指标的值，Pi(i=1，2，3，…，21)为第i个指标正规化后的值，0≤Pi≤1，Xs,i(Xs,i=Xmax-Xmin)，为第i个评价指标的标准值，Xmax为最大值，Xmin为最小值。（1）对于越高越好的`指标①Xi≥Xmax，则Pi=1；②Xi≤Xmin，则Pi=0；③Xmin

三、聚类分析

1、聚类步骤(Stage).从1~3表示聚类的先后顺序。

2、个案合并(ClusterCombined)。表示在某步中合并的个案，如第一步中个案1叶县田庄盐矿段和个案2叶县马庄盐矿段合并，合并以后用第一项的个案号表示生成的新类。

3、相似系数(Coefficients).据聚类分析的基本原理，个案之间亲密程度最高即相似系数最接近于1的，最先合并。因此该列中的系数与第一列的聚类步骤相对应，系数值从小到大排列。

4、新类首次出现的步骤(StageClusterFirstAppears)。对应于各聚类步骤参与合并的两项中，如果有一个是新生成的类(即由两个或两个以上个案合并成的类)，则在对应列中显示出该新类在哪一步第一次生成。如第三步中该栏第一列显示值为1，表示进行合并的两项中第一项是在第一步第一次生成的新类。如果值为O，则表示对应项还是个案(不是新类)。

5、新类下次出现步骤(NextStage)。表示对应步骤生成的新类将在第几步与其他个案或新类合并。如第一行的值是11，表示第一步聚类生成的新类将在第11步与其他个案或新类合并。

6、解析图DendrogramusingAverageLinkage(BetweenGroups)RescaledDistanceClusterCombine聚类树状图（方法：组间平均连接法）图清晰的显示了聚类的全过程。他将实际距离按比例调整到0~25之间，用逐级连线的方式连接性质相近的个案或新类，直至并未一类。在该图上部的距离标尺上根据需要(粗分或细分)选定一个划分类的距离值，然后垂直标尺划线，该垂线将与水平连线相交，则相交的交点数即为分类的类别数，相交水平连线所对应的个案聚成一类。例如，选标尺值为5，则聚为3类：叶县田庄盐段、叶县马庄盐矿段为一类，叶县娄庄盐矿、叶县五里堡盐矿段为一类，叶县姚寨盐矿为一类。若选标尺值为10，则聚为2类：叶县田庄盐段、叶县马庄盐矿段为一类，叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。

四、结论

对平顶山市5个盐矿区进行经济区划分，究竟划分为几个区合适，既不是越多越好，也不是越少越好。划分经济区的目的，就是要根据各盐矿经济区资源特点、勘察、开发的不同，分类指导经济活动，使人们的经济活动更加符合当地的实际，使各经济区能充分发挥各自的优势，做到扬长避短，趋利避害，达到投人少、产出多，创造良好的经济效益和社会效益之目的。分区太多，就失去了分区的意义，分区太少，则分类指导很难做到有的放矢。综合以上聚类分析结果，我们可以得出三个方案。其中两个方案比较合适,可供选择。方案一：（当比例尺为5时，分为3类）叶县田庄盐段、叶县马庄盐矿段为一类，叶县娄庄盐矿、叶县五里堡盐矿段为一类，叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案一。方案二：(当比例尺为10时，分为2类）叶县田庄盐段、叶县马庄盐矿段为一类，叶县娄庄盐矿、叶县五里堡盐矿段、叶县姚寨盐矿为一类。从聚类分析中看出平顶山市盐矿区分类图方案二。平顶山市盐矿区分类图方案2聚类分析的原理就是将矿石质量、资源储量、勘查阶段、利用状况相近或相类似的矿区聚合在一起，其分析结果也是直观易见的。在此结合平顶山市实际行政区划以及矿山企业特征我们对铁矿区划分做一个调整使其理论与实际能够结合的更紧密使其更好的指导实践。

1、叶县田庄盐段、叶县马庄盐矿段为一类，这一类属于矿床规模相当，资源储量接近，勘查开发阶段接近，利用程度相当，故，可以分为一类。

2、叶县娄庄盐矿、叶县五里堡盐矿段为一类，这一类属于勘查开发阶段处于同一阶段。

3、叶县姚寨盐矿为一类，这一类属于储量较高，盐矿品位较高，故其勘察开采规划有别于其它两类。总的说来，运用聚类分析是基本成功的，大部分的分类是符合实际的。综合以上论述盐矿区划分如下表所示：当然聚类分析有其优点也有其缺点：(1)优点：聚类分析模型的优点就是直观，结论形式简明。(2)缺点：在样本量较大时，要获得聚类结论有一定困难。由于相似系数是根据被试的反映来建立反映被试问内在联系的指标，而实践中有时尽管从被试反映所得出的数据中发现他们之间有紧密的关系，但事物之间却无任何内在联系，此时，如果根据距离或相似系数得出聚类分析的结果，显然是不适当的，但是，聚类分析模型本身却无法识别这类错误。

房地产专升本毕业论文1.房地产经济走向：目前重庆，武汉，杭州等经济受到国家政策的打压房产的价格开始回落。2.房地产上市公司业绩的影响因素实证研究：房地产企业业绩影响因素研究现状运用线性回归的方法，选取流动负债率和长期负债率、有息融资率和无息融资率、长期借款率和短期借款率分别作为资本结构的衡量指标，而将总资产贡献率和总资产利润率分别作为公司业绩的衡量指标。研究结果表明:总体来看，各项指标相关性不显著，但是就所有指标而言，正负相关的倾向还是比较明显的。就这一实证结果，本文结合我国房地产行业的实际情况，分别从房地产行业所处的阶段特征、政策面的影响以及公司治理结构方面进行了分析。运用数据包络分析(DEA)模型评价房地产上市公司绩效，关注房地产上市公司的经营效率、管理效率及资本配置总体效率的价值评判标准，以我国房地产业23家具有代表性的房地产上市公司为研究对象，通过设立多输入和多输出的指标进行综合评价，找出相对有效的行业标杆，同时分析行业整体和单个公司的资源配置效率，并提出了优化资源配置和提高房地产上市公司绩效的途径。从我国上市公司绩效影响因素及货币政策、物价变动与绩效相关性的一般理论思考出发，揭示出了我国上市公司绩效受国家宏观政策影响的理论依据。(严格意义上来说绩效评价体系包括业绩目标、业绩辅导和业绩评价。但是现在一般都模糊了这种概念，把两者视为一样)从MM理论出发，引进货币传导机制理论和两权分离的相关理论，得出房地产这个行业的所有绩效指标都与货币政策、CP工存在一定相关性。得到物价上涨会对房地产这个行业的经济绩效产生一定的负面影响，国家的宏观政策对地产行业影响甚微的结论。分析比较了目前上市公司经营业绩评价的主要方法，并剖析其存在的不足之处，在此基础上引入因子分析模型，并构建评价上市公司经营业绩的指标体系，然后应用该模型对我国房地产上市公司经营业绩做实证研究，最后得出研究结论，并指出了由于会计信息失真等因素的存在，使得该研究方法存在一些局限性，从而在一定程度上影响了研究结果的现实指导意义。《我国房地产上市公司经营业绩实证研究》选取GDP作为衡量经济发展的数据支持，以房地产开发投资完成额作为房地产行业发展的适合量度，运用协整分析方法对我国房地产行业与经济增长之间的动态均衡关系作相关研究。结论是:房地产行业发展状况对当前GDP变动的影响并不是很显著，我国房地产行业的发展与经济增长之间不存在明显的因果关系。认为人民币升值通过两种途径对不同行业产生影响。一是因人民币升值所导致的资本成本和收入的提升，将在长时期内改变我国的经济结构，重新赋予行业不同的成长速度，并使不同行业的企业业绩出现分化。二是人民币升值在短期内改变行业内企业的资产、负债、收入、成本等账面价值，通过外汇折算差异影响其经营业绩。最后认为人民币升值将使房地产行业受益。而从理论分析的角度得出人民币升值对房地产行业的影响有利好、利空两方面。利空影响:货币持续过度升值会导致经济减速(因为FDI下降、净出口下降)，外资需要下降，从而使房地产需求下降并会导致通胀水平下降，从而使房地产价格涨速下降。利好影响:第一，升值预期导致外资对房地产的投资需求加大。货币升值预期会导致外资的涌入，并大量投资到房地产上。从而增加房地产投资需求，推高房价，这是货币升值过程中必然发生的;第二，收入效应及财富效应导致国内房地产需求增加。张敏利用理论结合模型回归分析研究了股权结构的三个关键因素(股权集中度、股权属性及股权流通性)与公司治理绩效的关系。得到结论(1)房地产行业的股权集中度低于市场平均水平，而且股东之间的力量比较均衡，大多数公司的股权结构都呈现出多元共治的局面，并且第一大股东控股比例与公司绩效没有明显关系。(2)分析股权控制类型时，发现国有控股企业与法人控股企业、流通股主导型企业的公司绩效都没有明显的差别。(3)国有股比重、流通股比重与经营绩效没有显著相关关系。而法人股比重与公司绩效有着显著负相关关系。(4)控股股东相对控制权越大，公司绩效越差。采用单位根检验、协整分析、误差修正模型以及Granger因果关系检验等现代经济学计量方法，对湖北省房地产业的发展与经济增长的关系进行实证研究。发现湖北省经济增长是房地产业发展的Granger原因，经济的快速增长带动了房地产经济的发展，反之房地产投资对经济拉动作用却不显著。介绍房地产开发投资与GDP关系的研究方法，并通过近十年来浙江省房地产开发投资对GDP增长的贡献和贡献率进行分析，以反映房地产市场发育程度及经济增长的稳定性和风险性。应用协整分析、误差修正模型技术以及Granger因果分析对我国房地产价格与GDP之间的关系进行了实证分析。实证结果表明:我国的房地产价格与GDP之间存在长期稳定的动态均衡关系;无论长期还是短期，我国的GDP波动都是房地产价格波动的Granger原因，GDP的走势对于房地产价格的涨跌起着决定性的影响，GDP的波动有助于预测房地产价格的走势;短期内经济的过热容易引起房地产价格的过快增长。利用误差修正模型对三者关系进行计量分析，得出协整关系的结论。定量结果表明，GDP、FDI对房地产价格有正向的推动作用，但GDP是主要影响因素。这个结果基本排除了境外“热钱”对房地产市场的冲击威胁假说。选取一系列房地产价格指标与宏观经济指标进行研究分析，总体看，我国房地产价格趋于合理，居民的住房购买能力逐渐加强。房地产价格的增长速度已经受到来自其他价格指数增长缓慢的压力，开始进入调整阶段;随着城镇居民可支配收入的逐渐提高，房价收入比不断降低，居民的购房能力逐步提高。在相当长的一段时间内，对房地产的需求仍将维持在一个较高的水平。房地产价格是基于宏观经济发展水平的平台上的，一旦价格增长过快，超过国民经济和社会发展的承受能力和消化能力，将带来非常严重的后果;但价格下降，也会对国民经济的发展带来一定的负面影响，并不是越低越好。从资本结构、股权结构、公司规模和公司风险等四个方面选取了可能影响企业盈利能力的多个指标变量运用因子模型进行了实证分析，但在财务指标的选取上，只是建立在规范研究的基础上，对影响经营业绩的变量只局限于财务指标本身，一些与经营业绩有重大因果关系的变量未选人，比如说国家的产业政策、宏观经济条件、公司管理者的能力、职工的技能水平等等因此此文使用因子分析方法对我国房地产上市公司经营业绩的分析在实际指导方面的作用有所下降。从房地产市场的过度需求、产业结构不合理、法律法规不完善、政府的执行效率有待完善、地产信息不对称、人民币升值等方面进行了理论分析，并提出一些建议。建立我国近年来房地产价格宏观经济影响因素的线性模型，选取6个宏观经济指标作为方程初始导入自变量，与房地产价格进行初步多元线性回归分析，以解决自变量之间多重共线性问题;进而选取出两个自变量与房地产价格建立多元线性回归方程，并对回归结果进行分析在一个简单的局部均衡模型基础上，利用1999一2003年全国31个省市的房地产市场的面板数据分析了中国房地产市场结构和价格问题。从房地产价值的自然增长、市场供求关系和心理预期三个方面探讨了房价波动的构成、机制和影响因素，并提出了相应的房价调控对策。运用2001一2003年中国上市公司年报中披露的分行业信息，研究了房地产类上市公司多元化水平与财务绩效和企业价值之间的关系。实证结果表明，多元化水平与财务绩效之间存在显著的负相关，但是与用托宾Q衡量的公司价值之间不存在显著的相关性。针对我国目前房地产泡沫膨胀可能波及金融安全的现状，提出了如何优化房地产业资本结构的问题，并根据2000一2002年深沪两地A股房地产上市公司资料，对我国房地产企业上市公司的资产负债率与公司规模、经营业绩之间的相关关系以及资本结构效应进行了实证分析，并提出相关的建议。论文从影响企业的绪论硕一七论文外部因素入手，分析外部因素对公司绩效的影响程度。结合我国的物价变动、货币政策与对上市公司的绩效的相关性进行实证性分析。并运用了实证分析法中的OSL分析法，得到上面的结论。这些结论可以帮助企业在我国当前的形势下如何提高自身的绩效与价值。可以为上市公司在物价变动时和当前货币政策条件如何利用财务杠杆来提高企业的绩效的目的提供帮助。通过聚类分析找出我国房地产上市公司的差距大小，并将其归为几类，以此总结出影响房地产上市公司盈利能力的因素所在，并提出企业发展对策和政策建议。论文由六章组成，本研究所采用聚类分析方法，具体分为两个步骤，首先，在不明确房地产上市公司能够分为几类的情况下，为避免主观误差，采用系统聚类的方式，从SPSS输出的树状图直观的看出不同公司之间的距离;在此基础上，确定分为几类，然后采用快速聚类的方式，将房地产上市公司分类，找出房地产上市公司的特点和共性。从房地产价格的相关理论出发，主要从房地产需求、房地产供给、房地产金融和房地产宏观调控等角度对影响房价的因素展开分析。以房地产统计数据为基础，采用计量经济学方法和统计分析方法，主要从实证角度分析各因素对房价的影响。首先，分析房地产需求各因素对房价的影响，明确了城镇住房制度改革、居民可支配收入增加、城市化、房地产投机和人民币升值预期等因素导致的房地产需求扩张是房价上涨的首要因素。随后，从房屋建造成本、土地价格等角度分析供给因素对房价的影响，并以北京、上海和武汉三城市为例分析了房价和地价的关系。接下来，以房地产开发投资来源及构成为基础，分析了房地产金融对房价的影响，指出个人住房贷款推动了房价的上涨。未完……

spss分析毕业论文

摘要摘要是文章主要内容的摘录，要求短、精、完整。字数少可几十字，多不超过三百字为宜[3]。摘要的规范摘要是对论文的内容不加注释和评论的简短陈述，要求扼要地说明研究工作的目的、研究方法和最终结论等，重点是结论，是一篇具有独立性和完整性的短文，可以引用、推广。关键词关键词是从论文的题名、提要和正文中选取出来的，是对表述论文的中心内容有实质意义的词汇。关键词是用作计算机系统标引论文内容特征的词语，便于信息系统汇集，以供读者检索。每篇论文一般选取3-8个词汇作为关键词，另起一行，排在“提要”的左下方。主题词是经过规范化的词，在确定主题词时，要对论文进行主题分析，依照标引和组配规则转换成主题词表中的规范词语。(参见《汉语主题词表》和《世界汉语主题词表》)。

需要演示结果，用科学的三线表，不用演示计算过程