软件开发的毕业论文主要写的是你开发软件的整个过程。 可行性分析,需求分析,总体设计,详细设计,编码,文档,测试等都要写的。 主要写的还是前五项是很重要的。文档也很重要,文档也是验证是不是一个全面的完整的,好的软件开发的标准之一,不可忽略。
软件开发的毕业论文主要写的是你开发软件的整个过程。 可行性分析,需求分析,总体设计,详细设计,编码,文档,测试等都要写的。 主要写的还是前五项是很重要的。文档也很重要,文档也是验证是不是一个全面的完整的,好的软件开发的标准之一,不可忽略。希望采纳
你们老师都不给模板的吗?上网找也都差不多,大概就是你说的这些
软件工程要发表论文,课题形式很多种:
1.软件项目(包括新业务开发)的需求分析和管理
2.软件开发项目管理方法研究与实施
3.软件系统的设计与实现(或分析与设计)
4.软件测试方法的研究与实践
5.软件开发关键技术的研究
6.其他软件相关课题开发等等。。。纯手打,求点赞。有写作相关的问题,欢迎私聊
1、标题
标题是文章的眉目。各类文章的标题,样式繁多,但无论是何种形式,总要以全部或不同的侧面体现作者的写作意图、文章的主旨。毕业论文的标题一般分为总标题、副标题、分标题几种。
2、目录
一般说来,篇幅较长的毕业论文,都设有分标题。设置分标题的论文,因其内容的层次较多,整个理论体系较庞大、复杂,故通常设目录。
3、内容提要
内容提要是全文内容的缩影。在这里,作者以极经济的笔墨,勾画出全文的整体面目;提出主要论点、揭示论文的研究成果、简要叙述全文的框架结构。
4、关键词
关键词是标示文献关键主题内容,但未经规范处理的主题词。它是为了文献标引工作,从论文中选取出来,用以表示全文主要内容信息款目的单词或术语。一篇论文可选取3~8个词作为关键词。
5、正文
正文是论文的核心部分,也是论文的主体部分,其功能就是:展开论题,分析论证。正文的内容就是深入分析文章引言提出的问题,运用理论研究和实践操作相结合进行分析论证,揭示出各专业领域客观事物内部错综复杂的联系及其规律性。
正文撰写的内容反映出文章的逻辑思维性和语言表达能力,决定了论文的可理解性和论证的说服力。正文撰写必须做到实事求是,客观真切,准备充分,思维逻辑清晰,层次分明,通俗易懂。
6、结论
结论应是毕业论文的最终的、总体的结论,换句话说,结论应是整篇论文的结局、是整篇论文的归宿,而不是某一局部问题或某一分支问题的结论,也不是正文中各段的小结的简单重复。
结论是该论文结论应当体现作者更深层的认识,且是从全篇论文的全部材料出发,经过推理、判断、归纳等逻辑分析过程而得到的新的学术总观念、总见解。
7、致谢语
致谢语可以作为"脚注"放在文章首页的最下面,也可以放在文章的最后。致谢的词语要诚恳,简洁恰当。
8、参考文献
参考文献(资料)附在论文的后面,较多的应加页列出,至少要离开文末四行。书写论文引用的文献资料方式,分为直接引用和间接引用两种。
直接引用原文,需要加上引号;间接引用,只是转述大意,又称意引,不加引号。对于引用的文章内容,要忠实原文,不可断章取义,为我所用;不能前后矛盾,牵强附会;论文写作中,作者应表明对引文的观点,立场即称赞或反对的态度。
扩展资料
列举参考文献的作用
(1)是尊重原作者,避免掠人之美的嫌疑,同时也表明作者治学态度严谨。
(2)文中引文若有差错时便于及时查对。
(3)使指导教师能清楚地了解作者对问题的研究的深度和广度。
(4)反映了作者为撰写论文而进行阅读的材料的范围和水平。
(5)有利于研究相同或相近题目的读者从参考文献(资料)中了解情况或受到启发。
(6)便于在毕业论文答辩时进行审阅和评定成绩。
参考资料来源:百度百科-毕业论文
可以的。一篇论文是可以主成分与因子分析都写的,只有语句通顺即可。论文(graduationstudy),按一门课程计,是普通中等专业学校、高等专科学校、本科院校、高等教育自学考试本科及研究生学历专业教育学业的最后一个环节,为对本专业学生集中进行科学研究训练而要求学生在毕业前总结性独立作业、撰写的论文。
因子得分*方差贡献率试试
毕业论文分几部分,该怎么写?其实很简单!
对于煤的工业分析而言,它可以确定出煤的整体组成部分,下面是由我整理的煤的工业分析技术论文,谢谢你的阅读。
浅谈煤的工业分析
摘要 :文章浅谈了煤的工业分析方法的要点、原理及测定过程中的注意事项,并对测试结果在实际工作中的应用作了简单的介绍。
关键字 :水分 灰分 挥发分 固定碳
Abstract: the article briefly discusses the coal industrial analysis method, principle and the main points of the matters needing attention in the process of measurement, and its application in the practical work of the result of the test made a simple introduction.
The keyword volatile moisture ash fixed carbon
中图分类号:TQ52文献标识码:A
正文:
煤的工业分析也称煤的技术分析或实用分析,在国家标准中,煤的工业分析是指包括煤的水分(M )、灰分(A )、挥发分(V )和固定碳(Fc )四个分析项目指标的测定的总称。煤的工业分析是了解煤质特性的主要指标,也是评价煤质的基本依据。通常煤的水分、灰分、挥发分是直接测出的,而固定碳是用差减法计算出来的。广义上讲,煤的工业分析还包括煤的全硫分和发热量的测定, 又叫煤的全工业分析。工业分析是一种规范性很强的定量分析方法,是在特定条件下所测得的各项数值。
1、煤的水分
煤的水分,是煤炭计价中的一个最基本指标。煤是多孔性固体,含有一定的水分。水分是煤中的无机组分,其含量和存在状态与煤的内部结构及外界有关。一般而言,水分的存在不利于煤的加工利用。
煤的水分按照它的存在状态及物理化学性质,可分为外在水分、内外水分及化合水三种类型。
煤的水分直接影响煤的使用、运输和储存。煤的水分增加,煤中有用成分相减少,且水分在燃烧时变成蒸汽要吸热,因而降低了煤的发热量。煤的水分增加,还增加了无效运输,并给卸车带来了困难。特点是冬季寒冷地区,经常发生冻车,影响卸车,影响生产,影响车周转,加剧了运输的紧张。煤的水分也容易引起煤炭粘仓而减小煤仓容量,甚至发生堵仓事故。
煤中水分按存在形态的不同分为两类,既游离水和化合水。煤的工业分析中只测试游离水,不测结晶水。
煤的游离水分又分为外在水分和内在水分。煤的全水分,是指煤质全部的游离水分,既煤中外在水分和内在水分之和,简记符号Mt。
煤的全水分测定可采用四种方法,即通氮干燥法、空气干燥法、微波干燥法及空气干燥的一步法和两步法。在我们实际的工作中用的是空气干燥法,即称取一定量粒度小于6mm的煤样,在空气流中,于105-110℃干燥至质量恒定,然后根据煤样的质量损失计算全水分的含量。
2、煤的灰分
煤的灰分不是煤中固有的成分,而是煤在规定条件下完全燃烧后的残留物,灰分简记符号为A,也表示灰分的质量分数。即煤中矿物质在一定条件下经一系列分解、化合等复杂反应而形成的的,是煤质矿物质的衍生物。灰分全部来自矿物质,组成和质量又不同于矿物质,煤的灰分和煤中的矿物质关系密切,对煤炭利用都有直接影响,工业上常用灰分产率估算煤中矿物质的含量。
煤的灰分可用来表示煤中矿物质的含量,通过测定煤中灰分产率,可以研究煤的其他性质,如含碳量、发热量、结渣性等,用以确定煤的质量和使用价值。
中国标准GB/T212-2001规定,灰分测定方法包括缓慢灰化法和快速灰化法两种。其中缓慢灰化法为仲裁法。
缓慢灰化法测定时,称取粒度小于0.2mm的空气干燥煤样(1±0.1)g(称准至0.0002g),均匀地摊平于灰皿中,放入马弗炉中,以每分钟不大于2cm的速度把灰皿推入炉内的炽热部位,即恒温区(若煤样着火发生爆燃,则实验作废),关上炉门,在(815±10)℃温度下灼烧40min。从炉中取出灰皿,冷却5min左右,移入干燥器中冷却至室温后称量并进行检查性灼烧。如遇检查性灼烧时结果不稳定,应改用缓慢灰化法重新测定。灰分低于15.00%时,不必进行检查性灼烧。
3、煤的挥发分和固定碳
(1)煤的挥发分
挥发分的概念 煤样在规定的条件下,隔绝空气加热,并进行水分校正后的挥发物质产率称为挥发分,简记符号为V。煤的挥发分主要是由水分、碳、氢的氧化物和碳水化合物(以CH4为主)组成,但不包括物理吸附水和矿物质中的二氧化碳。可以看出,挥发分不是煤中固有的挥发性物质,而是煤在特定条件下的热分解产物,所以煤的挥发分称为挥发分产率更确切。挥发分测定结果随加热温度、加热时间、加热速度以及实验设备的形式、试样容器的材质、大小不同而有所差异。因此说挥发分的测定是一个规范性很强的实验项目,只有采用合乎一定规范的条件进行分析测定,所得挥发分的数据才有可比性。
挥发分的测定 按国家标准GB/T212-2001的规定,挥发分的测定方法要点为:称取一定量的空气干燥煤样,放在带盖的瓷坩埚中,在(900±10)℃下,隔绝空气加热7min,以减少的质量占煤样质量百分数减去该煤样的水分的质量分数(Mad)作为煤样的挥发分
(2)煤的固定碳
煤的固定碳的概念 从测定煤样挥发分后的焦渣中减去灰分后的残留物称为固定碳,简记符号为FC。固定碳和挥发分一样不是煤中固有的成分,而是热分解产物。在组成上,固定碳除含有碳元素外,还包含氢、氧、氮和硫等元素。因此,固定碳与煤中有机质的碳元素含量是两个不同的概念,绝不可混淆。一般而言,煤中固定碳含量小于碳元素含量,只有在高煤化程度的煤中两者才比较接近。
固定碳的计算 煤的工业分析中,固定碳一般不直接测定,而是通过计算获得。在空气干燥煤样测定水分、灰分和挥发分后,由下式计算没的固定碳的质量分数
Wad(FC)=100-(Mad+Aad+Vad)
式中 Wad(FC) ——空气干燥煤样的固定碳的质量分数,%
Mad ——空气干燥煤样的水分的质量分数,%
Aad ——空气干燥煤样的灰分的质量分数,%
Vad ——空气干燥煤样的挥发分的质量分数,%
结论: 随着煤的煤化程度的增加,煤中水分开始下降很快,以后变化则不大;固定碳含量逐渐增加;挥发分产率则先增加后降低。若以干燥无灰基计算,挥发分产率随煤化程度增加呈线性关系下降。
参考文献
【1】 朱银惠《 煤化学 》 化学工业出版社 2004年8月
点击下页还有更多>>>煤的工业分析技术论文
论文的题目是选题的直接表达,是作者想要研究的问题,是一篇论文的主题。下面是我带来的关于工业设计毕业论文选题的内容,欢迎阅读参考!
1. 模块化机器人设计
2. 智能行走监测机器人设计
3. 未来家电设计——互联网生活时代设计
4. 未来家电设计——互联网生活时代设计
5. 创意生活——电子小产品设计
6. 未来家电设计——为高度城市密集化和资源集约有限化的时空设计
7. 创意生活——电子小产品设计
8. 情趣化家居生活产品设计
9. “风”格“风”尚美的风扇创意设计
10. “广州手信”文化创意产品设计
11. 创意生活用品开发设计
12. 环保节能公共设施设计
13. 低碳环保文具设计
14. 厨卫产品开发设计
15. 手提旅行箱造型设计
16. 公交候车亭造型设计
17. 绿色环保灯具设计
18. 公用电话亭造型设计
19. 可携带式氧气瓶设计
20. 轻便式家用创意除湿机设计
1. 装载机驾驶室的工业设计研究
2. 产品设计中工业设计与工程技术设计衔接过程研究
3. 工业设计专业工程基础类课程整合研究
4. 反求工程在工业设计中的应用研究
5. 面向工程机械的工业设计程序与方法研究
6. 基于逆向工程开发模式的工业设计流程研究
7. 大型工业设计企业(TDI)发展战略的研究
8. 电工产品工业设计与工程设计的统一性研究
9. 工业设计与船舶系统工程相关性研究
10. 工业设计中可用性工程的应用
11. 三一重工堆高机外观造型设计与研究
12. 工程机械产品形态设计研究
13. 基于文化内涵的和谐之门体验设计
14. 基于产品形象的工程机械工业设计研究
15. 关于应用人机工程学的研究
16. 基于Alias的逆向工业设计实践研究
17. 多功能睡床设计理论研究及工业设计实践
1. 面向产品设计自动化的人机工程研究与应用 限制性设计理论研究
2. 基于用户评价的房车造型设计方法研究 应用人机工程学研究
3. 面向家居产品定制设计的人机设计方法研究
4. 基于人机工程学的自动售药机的设计
5. 铁路客车设施设计新探讨
6. S180中老年人手机人性化设计研究
7. 宏茂科技的机床产品造型设计与研究
8. 安徽滁州卷烟厂自动化物流系统规划设计
9. 南京工业大学材料化学工程中心实验楼方案设计
10. 数控机床中人机工学应用研究
11. 非上路微型车新开发设计方法研究
12. 汽车驾驶室人机界面设计技术研究
13. 人机驱动的产品创新设计研究
14. 基于人机工程的数控机床外防护设计研究
15. 计算机辅助人机工程设计的虚拟人研究
16. “ETC3650”经济型数控车床防护结构设计
巨野煤田煤质分析及科学利用评价摘要]从工业、元素、工艺性质方面,对巨野煤田煤质进行了详细的分析,根据其煤质特点,进行科学论证,得出巨野煤田是优质动力用煤和炼焦用煤的结论,可以用来制备水煤浆,用于煤气化合成氨、合成甲醇及后续产品,用作焦化原料等。[关键词]煤质分析;煤质特点;科学利用;评价1巨野煤田煤质分析1.1煤的工业分析工业分析是确定煤组成最基本的方法。在指标中,灰分可近似代表煤中的矿物质,挥发分和固定碳可近似代表煤中的有机质。衡量煤灰分性能指标主要有灰分含量、灰分组成、煤灰熔融性(DT、ST、HT和FT)。其中煤灰熔融性是动力用煤和气化用煤的重要性能指标。一般以煤灰软化的温度(即灰熔点ST)作为衡量煤灰熔融性的指标。1.1.1龙固矿钻孔煤样工业分析结果(表1)变形温度(DT)为煤灰锥体尖端开始弯曲或变圆时的温度;软化温度(ST)为煤灰锥体弯曲至锥尖触及底板变成球形时的温度;半球温度(HT)为灰锥形变至近似半球形,即高约等于底长的一半时的温度;流动温度(FT)为煤灰锥体完全熔化展开成高度<1.5 mm薄层时的温度。1.1.2彭庄矿钻孔煤样工业分析结果(表2)2煤质特点及科学利用评价2.1巨野煤田煤质特点由煤炭科学研究总院《巨野矿区煤质特征及菜加工利用途径评价》2003.5可以看出巨野煤田煤质有如下特点:①灰分含量低,属于中、低灰煤层。②挥发分含量高,各煤层原煤的挥发分含量在33%以上,且差异不大,均属于高挥发分煤种。③磷含量特低;硫分含量上低下高。④干燥基低位热值高。各层煤的都比较高,且随原煤灰分的降低而升高。⑤粘结指数、胶质层厚度和焦油产率均较高。⑥碳、氢含量较高。碳含量在86.02%~86.51%之间,氢含量在5.41%~5.44%之间,C/H比值<16。⑦灰熔点上高下低。2.2成浆性实验评价2008年1月,华东理工大学对巨野煤田龙固矿(1#)、赵楼矿(2#)和彭庄矿(3#)原煤进行成浆性实验及评价。2.2.1成浆浓度实验成浆浓度是指剪切速率100 s-1,粘度为1 000 mPa·s,水煤浆能达到的浓度。采用双峰级配制浆,粗颗粒与细颗粒质量比为3∶7;选取腐殖酸盐作为添加剂,用量为煤粉质量的1%。制成一系列浓度的水煤浆,测量其流动性,观察水煤浆的表观粘度随成浆浓度上升的变化规律,结果如表10所示。由表10看出,随着煤浆浓度增大,煤浆表观粘度也明显升高。本实验3种煤样成浆浓度分别为龙固矿66%(wt);赵楼矿67%(wt);彭庄矿68%(wt)。2.2.2流变性实验水煤浆流变特性是指受外力作用发生流动与变形的特性。良好的流变性和流动性是气化水煤浆的重要指标之一。将实验用煤制成适宜浓度的水煤浆,然后用NXS-4 C型水煤浆粘度计测定其粘度。将水煤浆的表观粘度随剪切变化的规律绘制成曲线,观察水煤浆的流变特性,见表11。从表11可以看出,3种煤制成的水煤浆中,随着剪切速率增大,表观粘度都随之降低,均表现出一定的屈服假塑性。屈服假塑性有利于气化水煤浆的储存、泵送和雾化。2.2.3实验结论煤粉粗粒度(40~200目)和细颗粒(<200目)质量比为3∶7,腐殖酸盐作为添加剂,添加量为煤粉质量的1%时,龙固矿煤浆浓度为66%(wt)、赵楼矿煤浆浓度为67%(wt)、彭庄矿煤浆浓度为68%(wt),满足加压气流床水煤浆气化技术对水煤浆浓度的要求。2.3原料煤的应用2.3.1适合于制备水煤浆水煤浆不但是煤替代重油的首选燃料,而且是加压气流床水煤浆气化制备合成气的重要原料。同时它又是一种很有前途的清洁工业燃料。实践上,华东理工大学“巨野煤田原煤成浆性实验评价报告”表明:巨野煤田各矿井原料煤均适合于制备高浓度稳定水煤浆。2.3.2用于煤气化合成氨、合成甲醇及后续产品巨野煤田原煤属于高发热量的煤种(弹筒热平均值在28~31 MJ/kg之间),该煤有利于降低氧气和能量消耗,并能提高气化产率;因灰熔点较高(>1 300℃),有利于固态排渣。根据鞍钢和武钢分别使用双鸭山和平项山1/3焦煤作高炉喷吹的经验,巨野煤田的1/3焦煤与双鸭山和平顶山1/3焦煤一样成浆性较好,其1/3焦煤洗精煤可以制成水煤浆,作为德士古(Texaco)水煤浆气化炉高炉喷吹用原料。煤气化得到的合成气既可通过变换用于合成氨/尿素,又可经净化脱硫合成甲醇或二甲醚。以甲醇为基础可进一步合成其他约120余种化工产品。另外,还可利用甲醇制备醇醚燃料及合成液体烃燃料等。2.3.3用作焦化原料焦化用于生产冶金焦、化工焦,其副产焦炉煤气可用于合成甲醇或合成氨,副产煤焦油进行分离和深加工后可得到一系列化工原料及化工产品。由表12看出,巨野煤田大槽煤经过洗选以后,可以供将来的400万t/a焦化厂或者上海宝钢等大型钢铁企业生产I级焦炭时作配煤炼焦使用;灰分≤9.0%的8级精煤(2#),也可供华东地区的中小型焦化企业生产2级和3级冶金焦的配煤炼焦使用。此外,该煤也可以单独炼焦,但所生产焦炭的孔隙率偏高,最好进行配煤炼焦。2.3.4远景目标———煤制油煤直接液化可得到汽油、煤油等多种产品。巨野煤田的大部分煤层均为富油煤,尤其是15煤层平均焦油产率>12%,属高油煤;根据元素分析计算的碳氢比各煤层均<16%;大部分煤层挥发分>35%的气煤和气肥煤通过洗选后的精煤挥发分>37%,而其灰分<10%。因此,巨野煤田的煤炭都是较好的液化用原料煤。煤间接液化可制取液体烃类。煤经气化后,合成气通过F-T合成,可以制取液体烃类,如汽油、柴油、石腊等化工产品及化工原料。3结语综上所述,巨野煤田第三煤层大槽煤属于低灰、低硫、低磷、结焦性好、挥发分高、发热量高的煤炭资源,其中的气煤、1/3焦煤、气肥煤、肥煤、天然焦等是国内紧缺的煤种,它们的洗精煤不仅可作为炼焦用煤、动力用煤,而且是制备水煤浆和高炉喷吹气化的重要原料。因此,菏泽大力发展煤气化合成氨和甲醇并拉长产业链搞深度加工是必然的正确选择。
可以的。一篇论文是可以主成分与因子分析都写的,只有语句通顺即可。论文(graduationstudy),按一门课程计,是普通中等专业学校、高等专科学校、本科院校、高等教育自学考试本科及研究生学历专业教育学业的最后一个环节,为对本专业学生集中进行科学研究训练而要求学生在毕业前总结性独立作业、撰写的论文。
具体一点,说明白详细要求,我可以帮忙。
因子1与因子2所代表的因子载荷系数ΔR2代表r2改变量,属于调节效应范畴0.3左右代表的拟合度偏低
数据挖掘总结之主成分分析与因子分析主成分分析与因子分析1)概念:主成分分析概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。 PCA的目标是用一组较少的不相关变量代替大量相关变量,同时尽可能保留初始变量的信息,这些推导所得的变量称为主成分,它们是观测变量的线性组合。因子分析概念:探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。进行EFA需要大量的样本,一般经验认为如何估计因子的数目为N,则需要有5N到10N的样本数目。 PCA/EFA 分析流程:(1)数据预处理;PCA和EFA都是根据观测变量间的相关性来推导结果。用户可以输入原始数据矩阵或相关系数矩阵列到principal()和fa()函数中,若输出初始结果,相关系数矩阵将会被自动计算,在计算前请确保数据中没有缺失值;(2)选择因子分析模型。判断是PCA(数据降维)还是EFA(发现潜在结构)更符合你的分析目标。选择EFA方法时,还需要选择一种估计因子模型的方法(如最大似然估计)。(3)判断要选择的主成分/因子数目;(4)选择主成分/因子;(5)旋转主成分/因子;(6)解释结果;(7)计算主成分或因子得分。2)、因子分析与主成分分析的区别①原理不同主成分分析基本原理:利用降维(线性变换)的思想,每个主成分都是原始变量的线性组合,且各个主成分之间互不相关。因子分析基本原理:利用降维的思想,从数据中提取对变量起解释作用的少数公共因子(因子分析是主成分的推广,相对于主成分分析,更倾向于描述原始变量之间的相关关系)②侧重点不同主成分分析侧重“变异量”,主成分分析是原始变量的线性组合,得出来的主成分往往从业务场景的角度难以解释因子分析更重视相关变量的“共变异量”,因子分析需要构造因子模型:EFA中的原始变量是公共因子的线性组合,因子是影响变量的潜在变量,目的是找到在背后起作用的少量关键因子,因子分析的结果往往更容易用业务知识去加以解释③ 因子分析的评价结果没有主成分分析准确; 因子分析比主成分分析的计算工作量大主成分分析:原始变量的线性组合表示新的综合变量,即主成分;EFA和PCA的区别在于:PCA中的主成分是原始变量的线性组合,而EFA中的原始变量是公共因子的线性组合,因子是影响变量的潜在变量,变量中不能被因子所解释的部分称为误差,因子和误差均不能直接观察到。进行EFA需要大量的样本,一般经验认为如何估计因子的数目为N,则需要有5N到10N的样本数目。
因子1与因子2所代表的因子载荷系数ΔR2代表r2改变量,属于调节效应范畴0.3左右代表的拟合度偏低
主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在实际课题中,为了全面分析问题,往往提出很多与此有关的变量(或因素),因为每个变量都在不同程度上反映这个课题的某些信息。
主成分分析与因子分析及SPSS实现一、主成分分析(1)问题提出在问题研究中,为了不遗漏和准确起见,往往会面面俱到,取得大量的指标来进行分析。比如为了研究某种疾病的影响因素,我们可能会收集患者的人口学资料、病史、体征、化验检查等等数十项指标。如果将这些指标直接纳入多元统计分析,不仅会使模型变得复杂不稳定,而且还有可能因为变量之间的多重共线性引起较大的误差。有没有一种办法能对信息进行浓缩,减少变量的个数,同时消除多重共线性?这时,主成分分析隆重登场。(2)主成分分析的原理主成分分析的本质是坐标的旋转变换,将原始的n个变量进行重新的线性组合,生成n个新的变量,他们之间互不相关,称为n个“成分”。同时按照方差最大化的原则,保证第一个成分的方差最大,然后依次递减。这n个成分是按照方差从大到小排列的,其中前m个成分可能就包含了原始变量的大部分方差(及变异信息)。那么这m个成分就成为原始变量的“主成分”,他们包含了原始变量的大部分信息。注意得到的主成分不是原始变量筛选后的剩余变量,而是原始变量经过重新组合后的“综合变量”。我们以最简单的二维数据来直观的解释主成分分析的原理。假设现在有两个变量X1、X2,在坐标上画出散点图如下:可见,他们之间存在相关关系,如果我们将坐标轴整体逆时针旋转45°,变成新的坐标系Y1、Y2,如下图:根据坐标变化的原理,我们可以算出:Y1 = sqrt(2)/2 * X1 + sqrt(2)/2 * X2Y2 = sqrt(2)/2 * X1 – sqrt(2)/2 * X2其中sqrt(x)为x的平方根。通过对X1、X2的重新进行线性组合,得到了两个新的变量Y1、Y2。此时,Y1、Y2变得不再相关,而且Y1方向变异(方差)较大,Y2方向的变异(方差)较小,这时我们可以提取Y1作为X1、X2的主成分,参与后续的统计分析,因为它携带了原始变量的大部分信息。至此我们解决了两个问题:降维和消除共线性。对于二维以上的数据,就不能用上面的几何图形直观的表示了,只能通过矩阵变换求解,但是本质思想是一样的。二、因子分析(一)原理和方法:因子分析是主成分分析的扩展。在主成分分析过程中,新变量是原始变量的线性组合,即将多个原始变量经过线性(坐标)变换得到新的变量。因子分析中,是对原始变量间的内在相关结构进行分组,相关性强的分在一组,组间相关性较弱,这样各组变量代表一个基本要素(公共因子)。通过原始变量之间的复杂关系对原始变量进行分解,得到公共因子和特殊因子。将原始变量表示成公共因子的线性组合。其中公共因子是所有原始变量中所共同具有的特征,而特殊因子则是原始变量所特有的部分。因子分析强调对新变量(因子)的实际意义的解释。举个例子:比如在市场调查中我们收集了食品的五项指标(x1-x5):味道、价格、风味、是否快餐、能量,经过因子分析,我们发现了:x1 = 0.02 * z1 + 0.99 * z2 + e1x2 = 0.94 * z1 – 0.01 * z2 + e2x3 = 0.13* z1 + 0.98 * z2 + e3x4 = 0.84 * z1 + 0.42 * z2 + e4x5 = 0.97 * z1 – 0.02 * z2 + e1(以上的数字代表实际为变量间的相关系数,值越大,相关性越大)第一个公因子z1主要与价格、是否快餐、能量有关,代表“价格与营养”第二个公因子z2主要与味道、风味有关,代表“口味”e1-5是特殊因子,是公因子中无法解释的,在分析中一般略去。同时,我们也可以将公因子z1、z2表示成原始变量的线性组合,用于后续分析。(二)使用条件:(1)样本量足够大。通常要求样本量是变量数目的5倍以上,且大于100例。(2)原始变量之间具有相关性。如果变量之间彼此独立,无法使用因子分析。在SPSS中可用KMO检验和Bartlett球形检验来判断。(3)生成的公因子要有实际的意义,必要时可通过因子旋转(坐标变化)来达到。三、主成分分析和因子分析的联系与区别联系:两者都是降维和信息浓缩的方法。生成的新变量均代表了原始变量的大部分信息且互相独立,都可以用于后续的回归分析、判别分析、聚类分析等等。区别:(1)主成分分析是按照方差最大化的方法生成的新变量,强调新变量贡献了多大比例的方差,不关心新变量是否有明确的实际意义。(2)因子分析着重要求新变量具有实际的意义,能解释原始变量间的内在结构。SPSS没有提供单独的主成分分析方法,而是混在因子分析当中,下面通过一个例子来讨论主成分分析与因子分析的实现方法及相关问题。 一、问题提出 男子十项全能比赛包含100米跑、跳远、跳高、撑杆跳、铅球、铁饼、标枪、400米跑、1500米跑、110米跨栏十个项目,总分为各个项目得分之和。为了分析十项全能主要考察哪些方面的能力,以便有针对性的进行训练,研究者收集了134个顶级运动员的十项全能成绩单,将通过因子分析来达到分析目的。 二、分析过程 变量视图: 数据视图(部分): 菜单选择(分析->降维->因子分析): 打开因子分析的主界面,将十项成绩选入”变量“框中(不要包含总分),如下: 点击”描述“按钮,打开对话框,选中”系数“和”KMO和Bartlett球形度检验“: 上图相关解释:”系数“:为变量之间的相关系数阵列,可以直观的分析相关性。”KMO和Bartlett球形度检验“:用于定量的检验变量之间是否具有相关性。点击”继续“,回到主界面,点击”抽取“,打开对话框。”方法“ =>”主成分“,”输出“=>”未旋转的因子解“和”碎石图“,”抽取“=>”基于特征值“,其余选择默认。 解释:①因子抽取的方法:选取默认的主成分法即可,其余方法的计算结果可能有所差异。②输出:”未旋转的因子解”极为主成分分析结果。碎石图有助于我们判断因子的重要性(详细介绍见后面)。③抽取:为抽取主成分(因子)的方法,一般是基于特征值大于1,默认即可。点击”继续“,回到主界面,点击”确定“,进入分析。输出的主要表格如下:(1)相关性检验因子分析要求变量之间有相关性,所以首先要进行相关性检验。首先输出的是变量之间的相关系数矩阵: 可以直观的看到,变量之间有相关性。但需要检验,接着输出的是相关性检验: 上图有两个指标:第一个是KMO值,一般大于0.7就说明不了之间有相关性了。第二个是Bartlett球形度检验,P值<0.001。综合两个指标,说明变量之间存在相关性,可以进行因子分析。否则,不能进行因子分析。(2)提取主成分和公因子接下来输出主成分结果: 这就是主成分分析的结果,表中第一列为10个成分;第二列为对应的”特征值“,表示所解释的方差的大小;第三列为对应的成分所包含的方差占总方差的百分比;第四列为累计的百分比。一般来说,选择”特征值“大于1的成分作为主成分,这也是SPSS默认的选择。在本例中,成分1和2的特征值大于1,他们合计能解释71.034%的方差,还算不错。所以我们可以提取1和2作为主成分,抓住了主要矛盾,其余成分包含的信息较少,故弃去。下面,输出碎石图,如下: 碎石图来源于地质学的概念。在岩层斜坡下方往往有很多小的碎石,其地质学意义不大。碎石图以特征值为纵轴,成分为横轴。前面陡峭的部分特征值大,包含的信息多,后面平坦的部分特征值小,包含的信息也小。由图直观的看出,成分1和2包含了大部分信息,从3开始就进入平台了。接下来,输出提取的成分矩阵: 上表中的数值为公因子与原始变量之间的相关系数,绝对值越大,说明关系越密切。公因子1和9个运动项目都正相关(注意跑步运动运动的计分方式,时间越短,分数越高),看来只能称为“综合运动”因子了。公因子2与铁饼、铅球正相关,与1500米跑、400米跑负相关,这究竟代表什么意思呢?看来只能成为“不知所云”因子了。(三)因子旋转前面提取的两个公因子一个是大而全的“综合因子”,一个不知所云,得到这样的结果,无疑是分析的失败。不过,不要灰心,我们可以通过因子的旋转来获得更好的解释。在主界面中点击“旋转”按钮,打开对话框,“方法”=>“最大方差法”,“输出”=>“旋转解”。 点击“继续”,回到主界面点击“确认”进行分析。输出结果如下: 这是选择后的成分矩阵。经过旋转,可以看出:公因子1得分越高,所有的跑步和跨栏成绩越差,而跳远、撑杆跳等需要助跑类项目的成绩也越差,所以公因子1代表的是奔跑能力的反向指标,可称为“奔跑能力”。公因子2与铁饼和铅球的正相关性很高,与标枪、撑杆跳等需要上肢力量的项目也正相关,所以该因子可以成为“上肢力量”。经过旋转,可以看出公因子有了更合理的解释。(四)结果的保存在最后,我们还要将公因子储存下来供后续使用。点击“得分”按钮,打开对话框,选中“保存为变量”,方法采用默认的“回归”方法,同时选中“显示因子得分系数矩阵”。 SPSS会自动生成2个新变量,分别为公因子的取值,放在数据的最后。同时会输出一个因子系数表格: 由上图,我们可以写出公因子的表达式(用F1、F2代表两个公因子,Z1~Z10分别代表原始变量):F1 = -0.16*Z1+0.161*Z2+0.145*Z3+0.199*Z4-0.131*Z5-0.167*Z6+0.137*Z7+0.174*Z8+0.131*Z9-0.037*Z10F2同理,略去。注意,这里的变量Z1~Z10,F1、F2不再是原始变量,而是标准正态变换后的变量。