因子得分*方差贡献率试试
职业病学毕业论文可以写当前比较热门的尘肺病。当时写的时候也是费了不少脑筋,还是上届的同学给的雅文网,那是帮了大忙啊广州市部分工厂工人职业病危害认知及影响因素的探讨浅议增强行业自律在我国职业病防治工作中的重要意义湖南省贯彻《职业病防治法》控制职业病危害近期效果及其影响因素的分析北京市西城区企业员工对职业病防治知识的知晓情况浅谈我国劳动保护与职业病防治2006—2010年广东省新发职业病病谱分析《中华人民共和国职业病防治法》实施前后合肥市诊断职业病资料分析2001—2010年广东省新发职业病分类分布特征分析宁夏部分企业职业病危害因素作业工人职业健康监护分析2003—2012年深圳市松岗街道职业病发病情况北京市西城区企业职工职业病防治知识知晓率调查分析唐山市重大职业病危害防范管理现状研究某煤电扩建工程职业病危害因素检测与分析职业病风险与雇主责任保险的风险管控浅谈职业病防治法中放射卫生工作的特殊管理3例职业病案例分析浙江省湖州市2008—2012年职业病报告病例分析 优先出版北京市职业病诊断与鉴定问题和对策深圳市光明新区2006~2011年职业病发病情况分析某公司乙醇胺装置建设项目职业病危害控制效果评价1例中毒性肝损害病例职业病诊断过程分析扬州市10年间职业病发病状况分析广西1992至2005年职业病发病情况的流行病学调查某机械公司新建项目职业病危害控制效果评价上海市闵行区19662004年职业病发病状况分析1992~2003年淄博市职业病发病情况分析广西2002年职业病发病报告与分析唐山市不同行业职业有害因素和职业病分析2007—2013年无锡市职业病发病情况分析
说实在话 不管你选什么题目 你是在毕业论这个前提下写的 毕业论文为的是啥 对普通大学生来讲还不是那个证(除非你真的很优秀 应聘的时候能准备把毕业论文作为炫耀的资本) 即使你不选DOTA为题 你选的那个题目难道毕业论文过后能被发表 然后又能实施么 那显然不可能 毕业论文主要是考察知识的运用能力 只要你选的那个题能最好的体现你的能力就行 就按你说的用成分分析和聚类等方法 看你怎么用了 方法用好了才是关键 如果你只是应付老师的话 可以写有利于提高大家对DOTA的认识啦 提高DOTA综合水平啦 以至于在国际对抗赛中取胜 为国家争的荣誉 电子竞技也属于体育竞技哦
你首先得跟你们导师说dota也是一门运动,比如足球等等它是体力运动,而dota呢它是脑力运动。也就是先要说明dota是有意义的。既然dota是一门运动,那么运动就有技巧,你这篇文章就是考试运动员就应该怎样运动,汽车你通过这些能运用上你的知识,就行了。
这个不难,我擅长.
可以参考下面的1、保险消费群体分析研究—以上海地区为例/以某险种为例2、美元走势与某大宗商品价格走势相关性分析3、基于多元统计的上海市各区县经济综合实力评价研究4、上海市人口规模与结构变动趋势分析5、GDP增速与居民收入增长变化相关性分析-以上海市为例6、上海市居民幸福感现状的调查研究7、上海市经济增长与环境污染的实证研究8、上海金融学院《统计学》课程考核满意度的调查研究9、上海市统计学本科毕业生就业的调查研究10、上海市城乡收入差距变动及其对经济的影响研究11、上海市经济增长、能源消费与环境污染间互动性研究12、上海市主导产业的选择研究--基于聚类分析和因子分析13、医药行业上市公司绩效评价--基于因子分析和聚类分析14、创业板上市公司经营绩效评价研究--基于因子分析和聚类分析15、电力行业上市经营绩效的实证研究--基于主成分分析、因子分析与聚类分析16、航运中心建设背景下上海市物流需求预测分析——基于XX预测技术17、上海市小微型科技企业融资能力的评估分析——基于XX分析方法18、大学生网络购物影响因素的实证研究——以上海金融学院为例19、大学生专业课自主学习的实证研究——以上海金融学院为例20、自贸区建设背景下大学生职业能力的现实考量与培养策略——以上海金融学院为例21、上海自由贸易区建设金融资源配置的统计数据分析及对策22、基于VAR模型的股票指数与宏观经济统计建模—以上海综合指数为例23、沪深300和道琼斯指数对比分析(或:股指期货与沪深300指数相关性分析)24、股票指数运行方向预测----基于成交量交易数据统计分析25、宏观经济与股票指数关系----基于货币发行量的统计分析视角26、基于因子分析法的上市公司财务状况评价研究27、因子分析法在中小企业板块上市公司综合业绩评价中的应用28、上海市各区县综合发展潜力评价研究29、上海市各区县经济发展潜力的综合评价研究30、上海市城镇居民消费的典型相关分析31、股票市场成交量和股价变动的统计实证研究——以A股市场为例32、基于高频数据的期货统计套利策略分析——以上海期货交易所铜期货合约为例33、多品种商品期货相关性研究——基于协整检验和误差修正模型的实证分析34、上证A股指数走势预测研究——基于时间序列模型35、大学生在数学学习中焦虑情绪产生因素分析——基于非参数统计方法36、上海银行间短期债券回购利率和同业拆借利率的协整分析37、上海(餐饮或)旅游市场需求预测研究——基于时间序列分析方法38、关于统计学专业应届生的就业优势因素分析——以上海地区为例39、基于协整检验的上海物流产业与经济增长互动关系研究40、基于股价高频数据的波动率与成交量动态关系研究——以A股市场为例41、上海技术进步对能源效率影响的实证分析42、中国各地区能源效率的测算与分析43、XX地区产业能源效率的测算与分析44、XX地区能源效率的影响因素分析45、XX地区能源消费与产业结构相关性研究
用谷歌翻译翻译一下,然后再稍微修改一下就好,一般毕业论文这里不会太在意的(当然具体情况也除外)
因子1与因子2所代表的因子载荷系数ΔR2代表r2改变量,属于调节效应范畴左右代表的拟合度偏低
可以的。一篇论文是可以主成分与因子分析都写的,只有语句通顺即可。论文(graduationstudy),按一门课程计,是普通中等专业学校、高等专科学校、本科院校、高等教育自学考试本科及研究生学历专业教育学业的最后一个环节,为对本专业学生集中进行科学研究训练而要求学生在毕业前总结性独立作业、撰写的论文。
用是肯定可以用的,我发表的论文也是用AHP作为模型,因子分析嘛,不是很熟,但是SPASS作为统计分析软件是十分好用的,只要你对它的操作流程熟悉,一般的模型构建都可以用到它。因子分析法和主成分分析法的区别与联系是什么?联系:因子分析法和主成分分析法都是统计分析方法,都要对变量标准化,并找出相关矩阵。区别:在主成分分析中,最终确定的新变量是原始变量的线性组合,因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系。1.因子分析法通过正交变换,将一组可能具有相关性的变量转换为一组线性不相关的变量,称为主成分。它主要用于市场研究领域。在市场研究中,研究人员关注一些研究指标的整合或组合。这些概念通常通过分数来衡量。人口学、数量地理学、分子动力学模拟、数学建模、数学分析等学科。因子分析和主成分分析都是统计分析方法,都需要对变量进行标准化,找出相关矩阵。2.因子分析可以在许多变量中发现隐藏的代表性因素。主成分分析的原理是尝试将原始变量重新组合成一组新的独立综合变量。因子分析在主成分分析的基础上增加了一个旋转函数。这种轮换的目的是更容易地命名和解释因素的含义。如果研究的重点是指标与分析项目之间的对应关系,或者想要对得到的指标进行命名,建议使用因子分析。
两个方法基本相同,只是因子分析是在主成分基础上,多出一步旋转步骤,为了让提取的成分更容易命名。两种方法都可以在网页版spssau中使用,配合智能文字建议和帮助手册可以能快理解。
如果说研究目的完全在于信息浓缩,并且找出因子与分析项对应关系,建议用因子分析。主成分分析更多用于权重计算,以及综合得分计算。
因子分析-SPSSAU
主成分分析-SPSSAU
用是肯定可以用的,我发表的论文也是用AHP作为模型,因子分析嘛,不是很熟,但是SPASS作为统计分析软件是十分好用的,只要你对它的操作流程熟悉,一般的模型构建都可以用到它。因子分析法和主成分分析法的区别与联系是什么?联系:因子分析法和主成分分析法都是统计分析方法,都要对变量标准化,并找出相关矩阵。区别:在主成分分析中,最终确定的新变量是原始变量的线性组合,因子分析是要利用少数几个公共因子去解释较多个要观测变量中存在的复杂关系。1.因子分析法通过正交变换,将一组可能具有相关性的变量转换为一组线性不相关的变量,称为主成分。它主要用于市场研究领域。在市场研究中,研究人员关注一些研究指标的整合或组合。这些概念通常通过分数来衡量。人口学、数量地理学、分子动力学模拟、数学建模、数学分析等学科。因子分析和主成分分析都是统计分析方法,都需要对变量进行标准化,找出相关矩阵。2.因子分析可以在许多变量中发现隐藏的代表性因素。主成分分析的原理是尝试将原始变量重新组合成一组新的独立综合变量。因子分析在主成分分析的基础上增加了一个旋转函数。这种轮换的目的是更容易地命名和解释因素的含义。如果研究的重点是指标与分析项目之间的对应关系,或者想要对得到的指标进行命名,建议使用因子分析。
论文数据方法有多选题研究、聚类分析和权重研究三种。
1、多选题研究:多选题分析可分为四种类型包括:多选题、单选-多选、多选-单选、多选-多选。
2、聚类分析:聚类分析以多个研究标题作为基准,对样本对象进行分类。如果是按样本聚类,则使用SPSSAU的进阶方法模块中的“聚类”功能,系统会自动识别出应该使用K-means聚类算法还是K-prototype聚类算法。
3、权重研究:权重研究是用于分析各因素或指标在综合体系中的重要程度,最终构建出权重体系。权重研究有多种方法包括:因子分析、熵值法、AHP层次分析法、TOPSIS、模糊综合评价、灰色关联等。
拓展资料:
一、回归分析
在实际问题中,经常会遇到需要同时考虑几个变量的情况,比如人的身高与体重,血压与年龄的关系,他们之间的关系错综复杂无法精确研究,以致于他们的关系无法用函数形式表达出来。为研究这类变量的关系,就需要通过大量实验观测获得数据,用统计方法去寻找他们之间的关系,这种关系反映了变量间的统计规律。而统计方法之一就是回归分析。
最简单的就是一元线性回归,只考虑一个因变量y和一个自变量x之间的关系。例如,我们想研究人的身高与体重的关系,需要搜集大量不同人的身高和体重数据,然后建立一个一元线性模型。接下来,需要对未知的参数进行估计,这里可以采用最小二乘法。最后,要对回归方程进行显著性检验,来验证y是否随着x线性变化。这里,我们通常采用t检验。
二、方差分析
在实际工作中,影响一件事的因素有很多,人们希望通过实验来观察各种因素对实验结果的影响。方差分析是研究一种或多种因素的变化对实验结果的观测值是否有显著影响,从而找出较优的实验条件或生产条件的一种数理统计方法。
人们在实验中所观察到的数量指标称为观测值,影响观测值的条件称为因素,因素的不同状态称为水平,一个因素可能有多种水平。
在一项实验中,可以得到一系列不同的观测值,有的是处理方式不同或条件不同引起的,称为因素效应。有的是误差引起的,称做实验误差。方差分析的主要工作是将测量数据的总变异按照变异原因的不同分解为因素效应和试验误差,并对其作出数量分析,比较各种原因在总变异中所占的重要程度,作为统计推断的依据。
例如,我们有四种不同配方下生产的元件,想判断他们的使用寿命有无显著差异。在这里,配方是影响元件使用寿命的因素,四种不同的配方成为四种水平。可以利用方差分析来判断。
三、判别分析
判别分析是用来进行分类的统计方法。我来举一个判别分析的例子,想要对一个人是否有心脏病进行判断,可以取一批没有心脏病的病人,测其一些指标的数据,然后再取一批有心脏病的病人,测量其同样指标的数据,利用这些数据建立一个判别函数,并求出相应的临界值。
这时候,对于需要判别的病人,还是测量相同指标的数据,将其带入判别函数,求得判别得分和临界值,即可判别此人是否属于有心脏病的群体。
四、聚类分析
聚类分析同样是用于分类的统计方法,它可以用来对样品进行分类,也可以用来对变量进行分类。我们常用的是系统聚类法。首先,将n个样品看成n类,然后将距离最近的两类合并成一个新类,我们得到n-1类,再找出最接近的两类加以合并变成n-2类,如此下去,最后所有的样品均在一类,将上述过程画成一张图。在图中可以看出分成几类时候每类各有什么样品。
比如,对中国31个省份的经济发展情况进行分类,可以通过收集各地区的经济指标,例如GDP,人均收入,物价水平等等,并进行聚类分析,就能够得到不同类别数量下是如何分类的。
五、主成分分析
主成分分析是对数据做降维处理的统计分析方法,它能够从数据中提取某些公共部分,然后对这些公共部分进行分析和处理。
在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。
主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。
最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。
如果第一主成分不足以代表原来P个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现在F2中,用数学语言表达就是要求Cov(F1, F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,……,第P个主成分。
六、因子分析
因子分析是主成分分析的推广和发展,它也是多元统计分析中降维的一种方法。因子分析将多个变量综合为少数几个因子,以再现原始变量与因子之间的相关关系。
在主成分分析中,每个原始变量在主成分中都占有一定的分量,这些分量(载荷)之间的大小分布没有清晰的分界线,这就造成无法明确表述哪个主成分代表哪些原始变量,也就是说提取出来的主成分无法清晰的解释其代表的含义。
因子分析解决主成分分析解释障碍的方法是通过因子轴旋转。因子轴旋转可以使原始变量在公因子(主成分)上的载荷重新分布,从而使原始变量在公因子上的载荷两级分化,这样公因子(主成分)就能够用哪些载荷大的原始变量来解释。以上过程就解决了主成分分析的现实含义解释障碍。
例如,为了了解学生的学习能力,观测了许多学生数学,语文,英语,物理,化学,生物,政治,历史,地理九个科目的成绩。为了解决这个问题,可以建立一个因子模型,用几个互不相关的公共因子来代表原始变量。我们还可以根据公共因子在原始变量上的载荷,给公共因子命名。
例如,一个公共因子在英语,政治,历史变量上的载荷较大,由于这些课程需要记忆的内容很多,我们可以将它命名为记忆因子。以此类推,我们可以得到几个能评价学生学习能力的因子,假设有记忆因子,数学推导因子,计算能力因子等。
接下来,可以计算每个学生的各个公共因子得分,并且根据每个公共因子的方差贡献率,计算出因子总得分。通过因子分析,能够对学生各方面的学习能力有一个直观的认识。
七、典型相关分析
典型相关分析同样是用于数据降维处理,它用来研究两组变量之间的关系。它分别对两组变量提取主成分。从同一组内部提取的主成分之间互不相关。用从两组之间分别提取的主成分的相关性来描述两组变量整体的线性相关关系。
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前 ,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用(我觉得不一定,可以单独用):a,了解数据。(screening the data),b,和cluster analysis一 起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。
在算法上,主成分分析和因子分析很类似,不过,在因子分析中所采用的协方差矩阵的对角元素不再是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。
因子分子提取的公因子比主成份提取的主成分更具有可解释性。作完探索性因子分析后就可以作确定性因子分析建立模型来明确潜在因子分析之间的关联性。
在社会调查中,对于同一个变量,研究者往往用多个不同的问题来测量一个人的意见。这些不同的问题构成了所谓的测度项,它们代表一个变量的不同方面。主成分分析法被用来对这些变量进行降维处理,使它们“浓缩”为一个变量,称为因子。在用主成分分析法进行因子求解时,我们最多可以得到与测度项个数一样多的因子。如果保留所有的因子,就起不到降维的目的了。但是我们知道因子的大小排列,我们可以对它们进行舍取。哪有那么多小的因子需要舍弃呢?在一般的行为研究中,我们常常用到的判断方法有两个:特征根大于1法与碎石坡法。因为因子中的信息可以用特征根来表示,所以我们有特征根大于1这个规则。如果一个因子的特征根大于1就保留,否则抛弃。这个规则,虽然简单易用,却只是一个经验法则(rule of thumb),没有明确的统计检验。不幸的是,统计检验的方法在实际中并不比这个经验法则更有效(Gorsuch, 1983)。所以这个经验法则至今仍是最常用的法则。作为一个经验法则,它不总是正确的。它会高估或者低估实际的因子个数。它的适用范围是20-40个的测度项,每个理论因子对应3-5个测度项,并且样本量是大的 ( 3100)。碎石坡法是一种看图方法。如果我们以因子的次序为X轴、以特征根大小为Y轴,我们可以把特征根随因子的变化画在一个坐标上,因子特征根呈下降趋势。这个趋势线的头部快速下降,而尾部则变得平坦。从尾部开始逆向对尾部画一条回归线,远高于回归线的点代表主要的因子,回归线两旁的点代表次要因子。但是碎石坡法往往高估因子的个数。这种方法相对于第一种方法更不可靠,所以在实际研究中一般不用。抛弃小因子、保留大因子之后,降维的目的就达到了。 在对社会调查数据进行分析时,除了把相关的问题综合成因子并保留大的因子,研究者往往还需要对因子与测度项之间的关系进行检验,以确保每一个主要的因子(主成分)对应于一组意义相关的测度项。为了更清楚的展现因子与测度项之间的关系,研究者需要进行因子旋转。常见的旋转方法是VARIMAX旋转。旋转之后,如果一个测度项与对应的因子的相关度很高(>)就被认为是可以接受的。如果一个测度项与一个不对应的因子的相关度过高(>),则是不可接受的,这样的测度项可能需要修改或淘汰。用主成分分析法得到因子,并用因子旋转分析测度项与因子关系的过程往往被称为探索性因子分析。在探索性因子分析被接受之后,研究者可以对这些因子之间的关系进行进一步测试,比如用结构方程分析来做假设检验。 1问题的提出主成分分析是一种降维的方法,便于分析问题,在诸多领域中都有广泛的应用。但有些教科书与论文使用主成分分析时,出现了一些错误与不足,不能解决实际问题。如一些多元统计分析的教材中,用协方差矩阵的主成分分析出现了如下错误与不足:①没有明确和判断该数据降维的条件是否成立。②主成分系数的平方和不为1。③没有明确和判断所用数据是否适合作单独的主成分分析。④选取的主成分对原始变量没有代表性。以下从相关性等理论与结果上依次解决上述问题,并给出相应建议。2数据在行为与心理研究中,常常要求分析某种身份的人的行为特征,如本例中的小学生的日常行为特征,从而根据这些特征引导小学生向更积极的行为态度发展。这里用文献[1]的数据见表1,其来自某课题组的调查结果。课题组对北方某小学480名5~6年级学生的日常行为进行调查,共调查了11项指标如下:S1~对老师提问的反应、S2~对班级事务的关心、S3~自习课上的表现、S4~对家庭作业的态度、S5~关心同学的程度、S6~对待劳动的态度、S7~学习上的特殊兴趣、S8~对待体育锻炼的态度、S9~在娱乐上的偏好、S10~解决问题的思考方式、S11~对未来的打算主成分分析法和层次分析法异同1.基于相关性分析的指标筛选原理两个指标之间的相关系数,反映了两个指标之间的相关性[1]。相关系数越大,两个指标反映的信息相关性就越高[1]。而为了使评价指标体系简洁有效,就需要避免指标反映信息重复[1]。通过计算同一准则层中各个评价指标之间的相关系数,删除相关系数较大的指标,避免了评价指标所反映的信息重复[2]。通过相关性分析,简化了指标体系,保证了指标体系的简洁有效[2]。2.基于主成分分析的指标筛选原理(1)因子载荷的原理通过对剩余多个指标进行主成分分析,得到每个指标的因子载荷。因子载荷的绝对值小于等于1,而绝对值越是趋向于1,指标对评价结果越重要[3]。(2)基于主成分分析的指标筛选原理因子载荷反映指标对评价结果的影响程度,因子载荷绝对值越大表示指标对评价结果越重要,越应该保留;反之,越应该删除。1通过对相关性分析筛选后的指标进行主成分分析,得到每个指标的因子载荷,从而删除因子载荷小的指标,保证筛选出重要的指标[2]。3.相关性分析和主成分分析相同点一是,基于相关性分析的指标筛选和基于主成分分析的指标筛选,均是在准则层内进行指标的筛选处理,准则层之间不进行筛选。这种做法的原因是,通过人为地划分不同准则层,反映评价事物不同层面的状况,避免误删反应信息不同的重要指标[2]。二是,基于相关性分析的指标筛选和基于主成分分析的指标筛选的思路,均是筛选出少量具有代表性的指标[2]。4.相关性分析和主成分分析不同点一是,两次筛选的目的不同:基于相关性分析的指标筛选的目的是删除反应信息冗余的评价指标。基于主成分分析的指标筛选的目的是删除对评价结果影响较小的评价指标[2]。二是,两次筛选的作用不同:基于相关性分析的指标筛选的作用是保证蹄选出的评价指标体系简洁明快。基于主成分分析的指标简选的目的是筛选出重要的指标[2]。[1]迟国泰,曹婷婷,张昆.基于相关主成分分析的人的全面发展评价指标体系的构建[J].系统工程理论与实践,2013,32(1):112-119.[2]李鸿禧.基于相关主成分分析的港口物流评价研究[D].辽宁大连:大连理工大学,2013.[3]孙慧,刘媛媛,张娜娜.基于主成分分析的煤炭产业竞争力实证研究[J].资源与产业,2012,14(1):145-149.
你的邮箱发不进去,请换一个,这里发部分供你参考Principal component analysisPrincipal component analysis (PCA) is a mathematical procedure that uses an orthogonal transformation to convert a set of observations of possibly correlated variables into a set of values of uncorrelated variables called principal components. The number of principal components is less than or equal to the number of original variables. This transformation is defined in such a way that the first principal component has as high a variance as possible (that is, accounts for as much of the variability in the data as possible), and each succeeding component in turn has the highest variance possible under the constraint that it be orthogonal to (uncorrelated with) the preceding components. Principal components are guaranteed to be independent only if the data set is jointly normally distributed. PCA is sensitive to the relative scaling of the original variables. Depending on the field of application, it is also named the discrete Karhunen–Loève transform (KLT), the Hotelling transform or proper orthogonal decomposition (POD).PCA was invented in 1901 by Karl Pearson.[1] Now it is mostly used as a tool in exploratory data analysis and for making predictive models. PCA can be done by eigenvalue decomposition of a data covariance matrix or singular value decomposition of a data matrix, usually after mean centering the data for each attribute. The results of a PCA are usually discussed in terms of component scores (the transformed variable values corresponding to a particular case in the data) and loadings (the weight by which each standarized original variable should be multiplied to get the component score) (Shaw, 2003).PCA is the simplest of the true eigenvector-based multivariate analyses. Often, its operation can be thought of as revealing the internal structure of the data in a way which best explains the variance in the data. If a multivariate dataset is visualised as a set of coordinates in a high-dimensional data space (1 axis per variable), PCA can supply the user with a lower-dimensional picture, a "shadow" of this object when viewed from its (in some sense) most informative viewpoint. This is done by using only the first few principal components so that the dimensionality of the transformed data is is closely related to factor analysis; indeed, some statistical packages (such as Stata) deliberately conflate the two techniques. True factor analysis makes different assumptions about the underlying structure and solves eigenvectors of a slightly different matrix.