统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
后期会把每一章的学习笔记链接加上
多元统计分析 是研究多个随机变量之间相互依赖关系及其内在统计规律的一门学科
在统计学的基本内容汇总,只考虑一个或几个因素对一个观测指标(变量)的影响大小的问题,称为 一元统计分析 。
若考虑一个或几个因素对两个或两个以上观测指标(变量)的影响大小的问题,或者多个观测指标(变量)的相互依赖关系,既称为 多元统计分析 。
有两大类,包括:
将数据归类,找出他们之间的联系和内在规律。
构造分类模型一般采用 聚类分析 和 判别分析 技术
在众多因素中找出各个变量中最佳的子集合,根据子集合所包含的信心描述多元系统的结果及各个因子对系统的影响,舍弃次要因素,以简化系统结构,认识系统的内核(有点做单细胞降维的意思)
可采用 主成分分析 、 因子分析 、 对应分析 等方法。
多元统计分析的内容主要有: 多元数据图示法 、 多元线性相关 与 回归分析 、 判别分析 、 聚类分析 、 主成分分析 、 因子分析 、 对应分析 及 典型相关分析 等。
多元数据是指具有多个变量的数据。如果将每个变量看作一个随机向量的话,多个变量形成的数据集将是一个随机矩阵,所以多元数据的基本表现形式是一个矩阵。对这些数据矩阵进行数学表示是我们的首要任务。也就是说,多元数据的基本运算是矩阵运算,而R语言是一个优秀的矩阵运算语言,这也是我们应用它的一大优势。
直观分析即图示法,是进行数据分析的重要辅助手段。例如,通过两变量的散点图可以考察异常的观察值对样本相关系数的影响,利用矩阵散点图可以考察多元之间的关系,利用多元箱尾图可以比较几个变量的基本统计量的大小差别。
相关分析就是通过对大量数字资料的观察,消除偶然因素的影响,探求现象之间相关关系的密切程度和表现形式。在经济系统中,各个经济变量常常存在内在的关系。例如,经济增长与财政收人、人均收入与消费支出等。在这些关系中,有一些是严格的函数关系,这类关系可以用数学表达式表示出来。还有一些是非确定的关系,一个变量产生变动会影响其他变量,使其产生变化。这种变化具有随机的特性,但是仍然遵循一定的规律。函数关系很容易解决,而那些非确定的关系,即相关关系,才是我们所关心的问题。
回归分析研究的主要对象是客观事物变量间的统计关系。它是建立在对客观事物进行大量实验和观察的基础上,用来寻找隐藏在看起来不确定的现象中的统计规律的方法。回归分析不仅可以揭示自变量对因变量的影响大小,还可以用回归方程进行预测和控制。回归分析的主要研究范围包括:
(1) 线性回归模型: 一元线性回归模型 , 多元线性回归模型 。 (2) 回归模型的诊断: 回归模型基本假设的合理性,回归方程拟合效果的判定,选择回归函数的形式。 (3) 广义线性模型: 含定性变量的回归 , 自变量含定性变量 , 因变量含定性变量 。 (4) 非线性回归模型: 一元非线性回归 , 多元非线性回归 。
在实际研究中,经常遇到一个随机变量随一个或多个非随机变量的变化而变化的情况,而这种变化关系明显呈非线性。怎样用一个较好的模型来表示,然后进行估计与预测,并对其非线性进行检验就成为--个重要的问题。在经济预测中,常用多元回归模型反映预测量与各因素之间的依赖关系,其中,线性回归分析有着广泛的应用。但客观事物之间并不一定呈线性关系,在有些情况下,非线性回归模型更为合适,只是建立起来较为困难。在实际的生产过程中,生产管理目标的参量与加工数量存在相关关系。随着生产和加工数量的增加,生产管理目标的参量(如生产成本和生产工时等)大多不是简单的线性增加,此时,需采用非线性回归分析进行分析。
鉴于统计模型的多样性和各种模型的适应性,针对因变量和解释变量的取值性质,可将统计模型分为多种类型。通常将自变量为定性变量的线性模型称为 一般线性模型 ,如实验设计模型、方差分析模型; 将因变量为非正态分布的线性模型称为 广义线性模型 ,如 Logistic回归模型 、 对数线性模型 、 Cox比例风险模型 。
1972年,Nelder对经典线性回归模型作了进一步的推广,建立了统一的理论和计算框架,对回归模型在统计学中的应用产生了重要影响。这种新的线性回归模型称为广义线性模型( generalized linear models,GLM)。
广义线性模型是多元线性回归模型的推广,从另一个角度也可以看作是非线性模型的特例,它们具有--些共性,是其他非线性模型所不具备的。它与典型线性模型的区别是其随机误差的分布 不是正态分布 ,与非线性模型的最大区别则在于非线性模型没有明确的随机误差分布假定,而广义线性模型的 随机误差的分布是可以确定的 。广义线性模型 不仅包括离散变量,也包括连续变量 。正态分布也被包括在指数分布族里,该指数分布族包含描述发散状况的参数,属于双参数指数分布族。
判别分析是多元统计分析中用于 判别样本所属类型 的一种统计分析方法。所谓判别分析法,是在已知的分类之下,一旦有新的样品时,可以利用此法选定一个判别标准,以判定将该新样品放置于哪个类别中。判别分析的目的是对已知分类的数据建立由数值指标构成的 分类规则 ,然后把这样的规则应用到未知分类的样品中去分类。例如,我们获得了患胃炎的病人和健康人的一些化验指标,就可以从这些化验指标中发现两类人的区别。把这种区别表示为一个判别公式,然后对那些被怀疑患胃炎的人就可以根据其化验指标用判别公式来进行辅助诊断。
聚类分析是研究 物以类聚 的--种现代统计分析方法。过去人们主要靠经验和专业知识作定性分类处理,很少利用数学方法,致使许多分类带有主观性和任意性,不能很好地揭示客观事物内在的本质差别和联系,特别是对于多因素、多指标的分类问题,定性分类更难以实现准确分类。为了克服定性分类的不足,多元统计分析逐渐被引人到数值分类学中,形成了聚类分析这个分支。
聚类分析是一种分类技术,与多元分析的其他方法相比,该方法较为粗糙,理论上还不完善,但应用方面取得了很大成功。 聚类分析 与 回归分析 、 判别分析 一起被称为多元分析的三个主要方法。
在实际问题中,研究多变量问题是经常遇到的,然而在多数情况下,不同变量之间有一定相关性,这必然增加了分析问题的复杂性。主成分分析就是一种 通过降维技术把多个指标化为少数几个综合指标 的统计分析方法。如何将具有错综复杂关系的指标综合成几个较少的成分,使之既有利于对问题进行分析和解释,又便于抓住主要矛盾作出科学的评价,此时便可以用主成分分析方法。
因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法,但其目的是 用有限个不可观测的隐变量来解释原变量之间的相关关系 。主成分分析通过线性组合将原变量综合成几个主成分,用较少的综合指标来代替原来较多的指标(变量)。在多元分析中,变量间往往存在相关性,是什么原因使变量间有关联呢? 是否存在不能直接观测到的但影响可观测变量变化的公共因子呢?
因子分析就是寻找这些公共因子的统计分析方法,它是 在主成分的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别 。例如,在研究糕点行业的物价变动中,糕点行业品种繁多、多到几百种甚至上千种,但无论哪种样式的糕点,用料不外乎面粉、食用油、糖等主要原料。那么,面粉、食用油、糖就是众多糕点的公共因子,各种糕点的物价变动与面粉、食用油、糖的物价变动密切相关,要了解或控制糕点行业的物价变动,只要抓住面粉、食用油和糖的价格即可。
对应分析又称为相应分析,由法国统计学家于 1970年提出。对应分析是在因子分析基础之上发展起来的一种多元统计方法,是Q型和R型因子分析的联合应用。在经济管理数据的统计分析中,经常要处理三种关系,即 样品之间的关系(Q型关系)、变量间的关系(R型关系)以及样品与变量之间的关系(对应型关系) 。例如,对某一行业所属的企业进行经济效益评价时,不仅要研究经济效益指标间的关系,还要将企业按经济效益的好坏进行分类,研究哪些企业与哪些经济效益指标的关系更密切一些,为决策部门正确指导企业的生产经营活动提供更多的信息。这就需要有一种统计方法, 将企业(样品〉和指标(变量)放在一起进行分析、分类、作图,便于作经济意义.上的解释 。解决这类问题的统计方法就是对应分析。
在相关分析中,当考察的一组变量仅有两个时,可用 简单相关系数 来衡量它们;当考察的一组变量有多个时,可用 复相关系数 来衡量它们。大量的实际问题需要我们把指标之间的联系扩展到两组变量,即 两组随机变量之间的相互依赖关系 。典型相关分析就是用来解决此类问题的一种分析方法。它实际上是 利用主成分的思想来讨论两组随机变量的相关性问题,把两组变量间的相关性研究化为少数几对变量之间的相关性研究,而且这少数几对变量之间又是不相关的,以此来达到化简复杂相关关系的目的 。
典型相关分析在经济管理实证研究中有着广泛的应用,因为许多经济现象之间都是多个变量对多个变量的关系。例如,在研究通货膨胀的成因时,可把几个物价指数作为一组变量,把若干个影响物价变动的因素作为另一组变量,通过典型相关分析找出几对主要综合变量,结合典型相关系数对物价上涨及通货膨胀的成因,给出较深刻的分析结果。
多维标度分析( multidimensional scaling,MDS)是 以空间分布的形式表现对象之间相似性或亲疏关系 的一种多元数据分析方法。1958年,Torgerson 在其博士论文中首次正式提出这一方法。MDS分析多见于市场营销,近年来在经济管理领域的应用日趋增多,但国内在这方面的应用报道极少。多维标度法通过一系列技巧,使研究者识别构成受测者对样品的评价基础的关键维数。例如,多维标度法常用于市场研究中,以识别构成顾客对产品、服务或者公司的评价基础的关键维数。其他的应用如比较自然属性(比如食品口味或者不同的气味),对政治候选人或事件的了解,甚至评估不同群体的文化差异。多维标度法 通过受测者所提供的对样品的相似性或者偏好的判断推导出内在的维数 。一旦有数据,多维标度法就可以用来分析:①评价样品时受测者用什么维数;②在特定情况下受测者可能使用多少维数;③每个维数的相对重要性如何;④如何获得对样品关联的感性认识。
20世纪七八十年代,是现代科学评价蓬勃兴起的年代,在此期间产生了很多种评价方法,如ELECTRE法、多维偏好分析的线性规划法(LINMAP)、层次分析法(AHP)、数据包络分析法(EDA)及逼近于理想解的排序法(TOPSIS)等,这些方法到现在已经发展得相对完善了,而且它们的应用也比较广泛。
而我国现代科学评价的发展则是在20世纪八九十年代,对评价方法及其应用的研究也取得了很大的成效,把综合评价方法应用到了国民经济各个部门,如可持续发展综合评价、小康评价体系、现代化指标体系及国际竞争力评价体系等。
多指标综合评价方法具有以下特点: 包含若干个指标,分别说明被评价对象的不同方面 ;评价方法最终要 对被评价对象作出一个整体性的评判,用一个总指标来说明被评价对象的一般水平 。
目前常用的综合评价方法较多, 如综合评分法、综合指数法、秩和比法、层次分析法、TOPSIS法、模糊综合评判法、数据包络分析法 等。
R -- 永远滴神~
1. 因子分析模型 因子分析法是从研究变量内部相关的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。它的基本思想是将观测变量进行分类,将相关性较高,即联系比较紧密的分在同一类中,而不同类变量之间的相关性则较低,那么每一类变量实际上就代表了一个基本结构,即公共因子。对于所研究的问题就是试图用最少个数的不可测的所谓公共因子的线性函数与特殊因子之和来描述原来观测的每一分量。 因子分析的基本思想: 把每个研究变量分解为几个影响因素变量,将每个原始变量分解成两部分因素,一部分是由所有变量共同具有的少数几个公共因子组成的,另一部分是每个变量独自具有的因素,即特殊因子因子分析模型描述如下: (1)X = (x1,x2,…,xp)¢是可观测随机向量,均值向量E(X)=0,协方差阵Cov(X)=∑,且协方差阵∑与相关矩阵R相等(只要将变量标准化即可实现)。 (2)F = (F1,F2,…,Fm)¢ (m
174 浏览 3 回答
168 浏览 4 回答
355 浏览 3 回答
96 浏览 5 回答
230 浏览 1 回答
131 浏览 3 回答
339 浏览 3 回答
111 浏览 4 回答
220 浏览 3 回答
103 浏览 3 回答
341 浏览 4 回答
82 浏览 3 回答
287 浏览 4 回答
301 浏览 2 回答
169 浏览 3 回答