果是一种的话,请给出依据,比如有论 这么肯定好的事情
我给你发这份才完成好的,不要愁了
数据,,有,,
如果研究一个X或多个X对Y的影响关系,其中Y为定量数据,可使用线性回归分析,构建回归模型。如果研究一个X或多个X对Y的影响关系,其中Y为定类数据,可使用Logistic分析,构建Logistic回归模型。如果要分析1组X与一组Y之间的关系情况,可使用典型相关分析。如果要分析多个X与多个Y之间的影响关系情况,且样本量较小(通常小于200),可使用PLS回归分析。
双因素方差分析即可
有数理统计分析法和数理统计法两种概念,你看看是哪种。数理统计分析法(mathematical statistics method)是在矿床勘探中,用数理统计的原理研究勘探网度的一种方法。它在研究矿体形态和品位变化程度的基础上,根据预期探明储量的精度要求(即允许误差),计算出在一定的勘探地段面积内所需要的勘探工程数量,或每个勘探工程所控制的矿体面积。其计算式为:n=V2xP2;或s=SP2V2x,式中:n为在一定勘探地段面积内所需要的勘探工程数量;s为每个勘探工程所控制的矿体面积;S为已知矿化范围或选定的勘探地段的面积;P为储量的相对允许误差;Vx为勘探地段内矿体厚度或品位的变化系数。这种方法只能保证平均值具有给定精度,而对地质误差则未考虑,因此应用时要拥有足够的工程资料作计算依据,并结合地质情况加以分析。[数理统计法:数学的一门分支学科。它以概率论为基础运用统计学的方法对数据进行分析、研究导出其概念规律性(即统计规律)。它主要研究随机现象中局部(字样)与整体(母体)之间。以及各有关因素之间相互联系的规律性。它主要是利用样本的平均数、标准差、标准误、变异系数率、均方、检验推断、相关、回归、聚类分析、判别分析、主成分分析、正交试验、模糊数学和灰色系统理论等有关统计量的计算来对实验所取得的数据和测量、调查所获得的数据进行有关分6f研究得到所需结果的一种科学方法。它要求具有随机性,而且数据必须真实可靠,这是进行定量分析的基础。这种方法不可借助计算机来进行,亦更能达到快速、准确和实施大量计算的目的。
OK ,没、问、题、我、提、供。
统计工作的重要性:统计工作是利用科学的方法搜集、整理、分析和提供关于社会经济现象、某些特定事物发展规律的工作。它的过程就是搜集资料——整理加工——统计分析的过程,也就是从定性认识(统计设计)到定量认识(统计调查和统计整理),再到定量认识到定性认识(统计分析),(质——量——质)。因此提高统计分析的质量就是核心工作。而质量的提高要在前两项的基础上完成。提高统计数据质量作为统计工作的中心环节,是推动统计事业发展的生命线。 统计工作的作用:统计作为提供国民经济运行情况信息的重要工具,受到了国内与国外、政府与公众、学者与官员越来越广泛关注,统计工作是对社会,经济以及自然现象总体数量方面进行搜集,整理,分析过程的总称。
统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。 统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。 统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文 statista (国民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。 统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。 统计学的发展过程的三个阶段 第一阶段称之为“城邦政情”(Matters of state)阶段 “城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。 第二阶段称之为“政治算数”(Politcal arthmetic)阶段 与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。 “政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。 1690年英国威廉·配弟出版 (政治算数)一书作为这个阶段的起始标志 威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。 配弟在书中使用的数字有三类: 第一类是对社会经济现象进行统计调查和经验观察得到的数字因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多; 第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种: “(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法; (2)通过运用数字的理论性推理来进行推算的方法; (3)以平均数为基础进行推算的方法”; 第三类是为了进行理论性推理而采用的例示性的数字配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。 第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段 在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。 十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。 “统计分析科学”课程的出现是现代统计发展阶段的开端 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。 现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学和工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法 现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。 第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。 第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。 第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。 统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。
基本原理微量元素在各种天然物质中的含量,一般是服从对数正态分布或正态分布的,这就是应用数理统计方法确定背景值和异常下限的理论根据。因此,只有确认测区内元素含量是属于或近似于对数正态分布或正态分布时,才能用数理统计方法来确定背累值和异常下限。根据背景值的概念,当元素含量是属于或近似于对数正态分布或正态分布时,背景值就可用样本的几何平均值(xg)或算术平均值(x),众数(Mo),中位数(Me)来估计。因为几何平均值或算术平均值受极大值和极小值的影响较大,虽然众数和中位数不受极大值和极小值的影响,但当数据集中趋势不明显时,众数就求不出来,并且也随数据分组不同而异。因此,在估计背景值时,一定要考虑样本的特征,选出其最佳估计值。当含量服从对数正态分布时,计算公式为地球化学找矿方法式中: TL为对数异常下限; σ 为元素含量的对数标准离差; Co为背景值; K 为常数。当元素含量服从正态分布时,计算公式为地球化学找矿方法K 值一般可定为 1 ~ 3。K 值愈小,异常值出现的可能性愈大; K 值愈大,异常值出现的可能性愈小。例如,当 K =1 时,异常出现的概率为 9% ; 当 K =2 时,异常出现的概率为 3% ; 而当 K =3 时,异常出现的概率为 1% ,等等。K 值的选取主要是取决于测区内的成矿地质条件,还要考虑工作的目的和任务等。当测区内成矿地质条件良好,K 值应取小一些; 当成矿地质条件不好,K 值就要取大一些; 在初步普查阶段,主要是怕漏掉有找矿意义的异常,K 值要取小一些; 在详查阶段,主要是为避免混入非矿致异常,K 值就要取大一些。常用方法现以下面的实例来介绍确定背景值和异常下限的具体方法。在某铜矿区外围,采集了100 个土壤样品,Cu 分析结果及其对数值的统计结果见表7-1。如果 Cu 含量服从对数正态分布,试求出该区的背景值和异常下限。表7-1 Cu 分析结果及其对数结果(1)计算法直接计算法利用分析结果的对数值,直接求出其平均值:地球化学找矿方法式中: m 为不同分析结果的数目。本例的计算结果如下:地球化学找矿方法简化计算法这是为了突出地反映数据频率分布规律和简化运算时的计算方法。一般是按下列步骤和方法进行运算:第一步,将分析结果的对数值分成若干组。分组时,首先要根据数据本身的性质、变化范围和样本容量,以及样品分析和计算的精度,确定组数(n)和组距(l)。组数不宜过少或过多,一般以 5 ~7 组为宜,最多不能超过 15 ~20 组。要求每组平均不得少于 5 个数据,组距一般是在 lg(l/10- 6)=(1 ~ 5)之间。其次是确定分组的下界和上界,下界要小于数据中最低值; 上界要大于数据中最高值。上界与下界之差等于组距与组数之积。另外,确定上、下界时,应尽量使数据避开分组点的数值。第二步,将分组后的数据统计结果填入计算表内,其格式和内容见表7-2。表7-2 简化计算法分组后的统计结果第三步,利用下列公式求出分析结果对数值的平均值 和对数标准离差(σ):地球化学找矿方法本例计算结果为:地球化学找矿方法第四步,求背景值和异常下限:地球化学找矿方法TL= lg xg+ 2σ = 906 + 2 × 205 = 316查反对数表可得(10- 6): Co= 05; T = 70。(2)图解法第一步,将数据分组。第二步,将分组后的数据统计结果填入计算表内,其格式和内容见表7-3。表7-3 图解法分组后的数据统计结果第三步,编绘频率分布直方图,并以其绘制频率密度曲线。取一平面直角坐标系,以横坐标表示元素含量对数值(lgxi),并按此例标出下界、各分组点和上界。再以组距为底边,画一系列矩形,以矩形面积表示各组的频率(全部矩形面积之和为 100%),就得到频率分布直方图,再以其绘出频率密度曲线,如图 7 8所示。纵坐标表示的是频率分布密度,也就是频率与组距的比值。第四步,利用直方图求出众数对数值,再利用频率密度曲线求出含量对数标准离差。在直方图的最高的矩形内,连接 AC 和 BD,二者的交点所对应的横坐标就是众数对数值,再取频率密度曲线极大值(p)的 6 倍,作一平行横坐标轴的直线,其与频率密度曲线左翼的交点所对应的横坐标为 lgMo- σ,而与右翼的交点所对应的横坐标为 lgMo+ σ。则可求出含量对数标准离差。本例,求得 lgMo= 91,σ = 20。第五步,求出背景值和异常下限:取 Co= Mo,K =2,则TL= lgCo+ Kσ = 91 + 2 × 2 = 31查反对数表可得(10- 6): Co= 13; T = 42。图7-8 众数(Mo)与标准离差(σ)图解法示意图除上述图解法外,还可以利用累积频率图求出中位数对数值和含量对数标准离差,以中位数估计背景值,再求出异常下限。其步骤是: 第一步和第二步同上。第三步是绘制累积频率图。取一平面直角坐标系,以横坐标表示含量对数值,以纵坐标表示累积频率。再用组上限为横坐标,用该组对应的累积频率为纵坐标,依次绘出各坐标点的位置,最后用圆滑曲线将各点连接起来,就得到频率分布曲线(见图7-9)。如果采用概率格纸按上述方法绘图,则频率分布曲线展为直线(见图7-10)。第四步是利用频率分布曲线求出lgMe和 σ。频率分布曲线上累积频率为 50% 的点,所对应的横坐标为 lgMe,而累积频率为 9% ,1% 的点,所对应的横坐标为 lgMe- σ,lgMe+ σ。故可求出 σ。在图7 9和图 7 10 上求得:lgMe= 91; σ = 20。第五步是求出背景值和异常下限。本例求得(10- 6):Co= 13; T = 42。图7-9 中位数与标准离差图解法示意图图7-10 中位数与标准离差图解法示意图
一、重要性1 统计分析为决策者提供信息咨询监督服务统计数据能够更集中、更系统、更清楚地反映客观实际,便于阅读、理解和利用。统计数据是发挥统计的信息、咨询、监督功能的主要手段。统计分析是为决策者提供信息咨询和监督服务的主要指标。在经营运行中,统计工作在企业管理中的作用往往被企业管理者所忽视。在瞬息万变的社会经济中,领导部门和决策者仅凭个人能力和经验已经难以把转瞬即逝的局面,更难于对的发展规划做出相对科学的决策。在这种情况下统计分析的优势随之显现,它可以把数据、情况、问题、建议等融为一体,既有定量分析,又有定性分析比,可以对决策者提供更全面的指标分析数据,帮助决策者做出正确的判断。2 统计分析工作是实现良好监督,管理科学化和统计参与决策的有效手段。由于统计分析可以实现完整、全面、正确地反映客观现实的重要的作用,统计分析工作可以实现远程操控,而不必身临其境才能实现对企事业单位的分析,这使统计分析成为了实现良好监督的重要手段。统计部门掌握大量风准确的统计资料,可以比较全面准确地了解企业的大量信息,如企业的运转情况、经济运行情况和发展变化的情况等。在统计部门获得大量的统计分析结果的时候,就可以实现对企事业单位良好的监督功能,能够承担起监督企事业单位对政府相关政策的执行情况,生产和发展的完成情况,统计分析人员根据统计分析将结果用报告的形式写出来,则是实现监管人员对企事业单位进行监督的方式。这样,监管人员即使没有深入企事业单位内部进行调查研究,也可以根据统计分析报告对企事业单位进行监督。3 统计分析报告的质量,反映了统计工作的水平统计分析报告开展的整个过程可以合理有效的对每个工作环节的质量进行检验,能够比较实时发现问题,并采取高效的措施进行改进,顺利地解决工作中出现的问题,通过提出新法案、新解决措施来保证工作的顺利完成。而且长时间的使用统计报告分析,对于提高工作人员的综合素质来说是比较有用的,归根到底就是说,写好统计分析报告具有不可替代的重要意义,不能够盲目的认为统计报表才是一定要完成的任务,统计分析则是可有可无的,要及时的纠正这样的错误思想,摆正二者的重要地位。4 统计分析是促进统计工作良好发展的重要保证做好统计分析工作能够促进统计工作的发展,有利于促进统计人员工作能力的提升。我们可以通过对统计资料进行分析,能够很好的找出过去统计工作过程中存在的一些问题,在找到这些问题之后还能够及时的进行纠正,这样一来就有效的推动了统计工作的发展。另外我们在开展统计分析工作时,统计人员在研究数字的内涵以及其内在关系的过程中还可以促进统计数字质量的提升,从而有利于提升统计人员的综合素质。同时对统计人员及时掌握市场变动方向和企业发展情况,变被动为主动,及时收集相关信息,并将这些信息和资料加以整理和分析,找出生产经营环节中存在的内在联系,探索经济发展规律起到积极的作用。 二、作用从整体上反映和分析事物数量特征,观察事物的本质和发展规律,作出正确的判断。例如,只有对大量的生育人口进行观察才能得出男孩,女孩的出生比例,若只对个别家庭观察是很难得出这一结论的。从宏观上看,是国家宏观调控和管理的重要工具。从微观上看,是企业管理与决策的依据。日常生活中,统计可以宣传群众、教育群众。是进行科学研究的重要方法。通过数字揭示事物在特定时间方面的数量特征,以便对事物进行定量乃至定性分析,从而做出正确的决策。正因如此,统计信息越来越多地和其他信息结合在一起,如情报信息,商品信息等。而诸如此类信息,以统计数字显示或以统计数字为依据,可利用程度大为提高。
基本原理微量元素在各种天然物质中的含量,一般是服从对数正态分布或正态分布的,这就是应用数理统计方法确定背景值和异常下限的理论根据。因此,只有确认测区内元素含量是属于或近似于对数正态分布或正态分布时,才能用数理统计方法来确定背累值和异常下限。根据背景值的概念,当元素含量是属于或近似于对数正态分布或正态分布时,背景值就可用样本的几何平均值(xg)或算术平均值(x),众数(Mo),中位数(Me)来估计。因为几何平均值或算术平均值受极大值和极小值的影响较大,虽然众数和中位数不受极大值和极小值的影响,但当数据集中趋势不明显时,众数就求不出来,并且也随数据分组不同而异。因此,在估计背景值时,一定要考虑样本的特征,选出其最佳估计值。当含量服从对数正态分布时,计算公式为地球化学找矿方法式中: TL为对数异常下限; σ 为元素含量的对数标准离差; Co为背景值; K 为常数。当元素含量服从正态分布时,计算公式为地球化学找矿方法K 值一般可定为 1 ~ 3。K 值愈小,异常值出现的可能性愈大; K 值愈大,异常值出现的可能性愈小。例如,当 K =1 时,异常出现的概率为 9% ; 当 K =2 时,异常出现的概率为 3% ; 而当 K =3 时,异常出现的概率为 1% ,等等。K 值的选取主要是取决于测区内的成矿地质条件,还要考虑工作的目的和任务等。当测区内成矿地质条件良好,K 值应取小一些; 当成矿地质条件不好,K 值就要取大一些; 在初步普查阶段,主要是怕漏掉有找矿意义的异常,K 值要取小一些; 在详查阶段,主要是为避免混入非矿致异常,K 值就要取大一些。常用方法现以下面的实例来介绍确定背景值和异常下限的具体方法。在某铜矿区外围,采集了100 个土壤样品,Cu 分析结果及其对数值的统计结果见表7-1。如果 Cu 含量服从对数正态分布,试求出该区的背景值和异常下限。表7-1 Cu 分析结果及其对数结果(1)计算法直接计算法利用分析结果的对数值,直接求出其平均值:地球化学找矿方法式中: m 为不同分析结果的数目。本例的计算结果如下:地球化学找矿方法简化计算法这是为了突出地反映数据频率分布规律和简化运算时的计算方法。一般是按下列步骤和方法进行运算:第一步,将分析结果的对数值分成若干组。分组时,首先要根据数据本身的性质、变化范围和样本容量,以及样品分析和计算的精度,确定组数(n)和组距(l)。组数不宜过少或过多,一般以 5 ~7 组为宜,最多不能超过 15 ~20 组。要求每组平均不得少于 5 个数据,组距一般是在 lg(l/10- 6)=(1 ~ 5)之间。其次是确定分组的下界和上界,下界要小于数据中最低值; 上界要大于数据中最高值。上界与下界之差等于组距与组数之积。另外,确定上、下界时,应尽量使数据避开分组点的数值。第二步,将分组后的数据统计结果填入计算表内,其格式和内容见表7-2。表7-2 简化计算法分组后的统计结果第三步,利用下列公式求出分析结果对数值的平均值 和对数标准离差(σ):地球化学找矿方法本例计算结果为:地球化学找矿方法第四步,求背景值和异常下限:地球化学找矿方法TL= lg xg+ 2σ = 906 + 2 × 205 = 316查反对数表可得(10- 6): Co= 05; T = 70。(2)图解法第一步,将数据分组。第二步,将分组后的数据统计结果填入计算表内,其格式和内容见表7-3。表7-3 图解法分组后的数据统计结果第三步,编绘频率分布直方图,并以其绘制频率密度曲线。取一平面直角坐标系,以横坐标表示元素含量对数值(lgxi),并按此例标出下界、各分组点和上界。再以组距为底边,画一系列矩形,以矩形面积表示各组的频率(全部矩形面积之和为 100%),就得到频率分布直方图,再以其绘出频率密度曲线,如图 7 8所示。纵坐标表示的是频率分布密度,也就是频率与组距的比值。第四步,利用直方图求出众数对数值,再利用频率密度曲线求出含量对数标准离差。在直方图的最高的矩形内,连接 AC 和 BD,二者的交点所对应的横坐标就是众数对数值,再取频率密度曲线极大值(p)的 6 倍,作一平行横坐标轴的直线,其与频率密度曲线左翼的交点所对应的横坐标为 lgMo- σ,而与右翼的交点所对应的横坐标为 lgMo+ σ。则可求出含量对数标准离差。本例,求得 lgMo= 91,σ = 20。第五步,求出背景值和异常下限:取 Co= Mo,K =2,则TL= lgCo+ Kσ = 91 + 2 × 2 = 31查反对数表可得(10- 6): Co= 13; T = 42。图7-8 众数(Mo)与标准离差(σ)图解法示意图除上述图解法外,还可以利用累积频率图求出中位数对数值和含量对数标准离差,以中位数估计背景值,再求出异常下限。其步骤是: 第一步和第二步同上。第三步是绘制累积频率图。取一平面直角坐标系,以横坐标表示含量对数值,以纵坐标表示累积频率。再用组上限为横坐标,用该组对应的累积频率为纵坐标,依次绘出各坐标点的位置,最后用圆滑曲线将各点连接起来,就得到频率分布曲线(见图7-9)。如果采用概率格纸按上述方法绘图,则频率分布曲线展为直线(见图7-10)。第四步是利用频率分布曲线求出lgMe和 σ。频率分布曲线上累积频率为 50% 的点,所对应的横坐标为 lgMe,而累积频率为 9% ,1% 的点,所对应的横坐标为 lgMe- σ,lgMe+ σ。故可求出 σ。在图7 9和图 7 10 上求得:lgMe= 91; σ = 20。第五步是求出背景值和异常下限。本例求得(10- 6):Co= 13; T = 42。图7-9 中位数与标准离差图解法示意图图7-10 中位数与标准离差图解法示意图
数据可从网上搜索,统计年鉴及各大数据库都有再通过统计软件作分析,例如相关分析和回归分析,这种论文偏理论型也可以通过设计调查问卷,可针对身边某一热点问题进行调查,如消费观,就业观,来搜集数据,再写一篇调查报告
基本原理微量元素在各种天然物质中的含量,一般是服从对数正态分布或正态分布的,这就是应用数理统计方法确定背景值和异常下限的理论根据。因此,只有确认测区内元素含量是属于或近似于对数正态分布或正态分布时,才能用数理统计方法来确定背累值和异常下限。根据背景值的概念,当元素含量是属于或近似于对数正态分布或正态分布时,背景值就可用样本的几何平均值(xg)或算术平均值(x),众数(Mo),中位数(Me)来估计。因为几何平均值或算术平均值受极大值和极小值的影响较大,虽然众数和中位数不受极大值和极小值的影响,但当数据集中趋势不明显时,众数就求不出来,并且也随数据分组不同而异。因此,在估计背景值时,一定要考虑样本的特征,选出其最佳估计值。当含量服从对数正态分布时,计算公式为地球化学找矿方法式中: TL为对数异常下限; σ 为元素含量的对数标准离差; Co为背景值; K 为常数。当元素含量服从正态分布时,计算公式为地球化学找矿方法K 值一般可定为 1 ~ 3。K 值愈小,异常值出现的可能性愈大; K 值愈大,异常值出现的可能性愈小。例如,当 K =1 时,异常出现的概率为 9% ; 当 K =2 时,异常出现的概率为 3% ; 而当 K =3 时,异常出现的概率为 1% ,等等。K 值的选取主要是取决于测区内的成矿地质条件,还要考虑工作的目的和任务等。当测区内成矿地质条件良好,K 值应取小一些; 当成矿地质条件不好,K 值就要取大一些; 在初步普查阶段,主要是怕漏掉有找矿意义的异常,K 值要取小一些; 在详查阶段,主要是为避免混入非矿致异常,K 值就要取大一些。常用方法现以下面的实例来介绍确定背景值和异常下限的具体方法。在某铜矿区外围,采集了100 个土壤样品,Cu 分析结果及其对数值的统计结果见表7-1。如果 Cu 含量服从对数正态分布,试求出该区的背景值和异常下限。表7-1 Cu 分析结果及其对数结果(1)计算法直接计算法利用分析结果的对数值,直接求出其平均值:地球化学找矿方法式中: m 为不同分析结果的数目。本例的计算结果如下:地球化学找矿方法简化计算法这是为了突出地反映数据频率分布规律和简化运算时的计算方法。一般是按下列步骤和方法进行运算:第一步,将分析结果的对数值分成若干组。分组时,首先要根据数据本身的性质、变化范围和样本容量,以及样品分析和计算的精度,确定组数(n)和组距(l)。组数不宜过少或过多,一般以 5 ~7 组为宜,最多不能超过 15 ~20 组。要求每组平均不得少于 5 个数据,组距一般是在 lg(l/10- 6)=(1 ~ 5)之间。其次是确定分组的下界和上界,下界要小于数据中最低值; 上界要大于数据中最高值。上界与下界之差等于组距与组数之积。另外,确定上、下界时,应尽量使数据避开分组点的数值。第二步,将分组后的数据统计结果填入计算表内,其格式和内容见表7-2。表7-2 简化计算法分组后的统计结果第三步,利用下列公式求出分析结果对数值的平均值 和对数标准离差(σ):地球化学找矿方法本例计算结果为:地球化学找矿方法第四步,求背景值和异常下限:地球化学找矿方法TL= lg xg+ 2σ = 906 + 2 × 205 = 316查反对数表可得(10- 6): Co= 05; T = 70。(2)图解法第一步,将数据分组。第二步,将分组后的数据统计结果填入计算表内,其格式和内容见表7-3。表7-3 图解法分组后的数据统计结果第三步,编绘频率分布直方图,并以其绘制频率密度曲线。取一平面直角坐标系,以横坐标表示元素含量对数值(lgxi),并按此例标出下界、各分组点和上界。再以组距为底边,画一系列矩形,以矩形面积表示各组的频率(全部矩形面积之和为 100%),就得到频率分布直方图,再以其绘出频率密度曲线,如图 7 8所示。纵坐标表示的是频率分布密度,也就是频率与组距的比值。第四步,利用直方图求出众数对数值,再利用频率密度曲线求出含量对数标准离差。在直方图的最高的矩形内,连接 AC 和 BD,二者的交点所对应的横坐标就是众数对数值,再取频率密度曲线极大值(p)的 6 倍,作一平行横坐标轴的直线,其与频率密度曲线左翼的交点所对应的横坐标为 lgMo- σ,而与右翼的交点所对应的横坐标为 lgMo+ σ。则可求出含量对数标准离差。本例,求得 lgMo= 91,σ = 20。第五步,求出背景值和异常下限:取 Co= Mo,K =2,则TL= lgCo+ Kσ = 91 + 2 × 2 = 31查反对数表可得(10- 6): Co= 13; T = 42。图7-8 众数(Mo)与标准离差(σ)图解法示意图除上述图解法外,还可以利用累积频率图求出中位数对数值和含量对数标准离差,以中位数估计背景值,再求出异常下限。其步骤是: 第一步和第二步同上。第三步是绘制累积频率图。取一平面直角坐标系,以横坐标表示含量对数值,以纵坐标表示累积频率。再用组上限为横坐标,用该组对应的累积频率为纵坐标,依次绘出各坐标点的位置,最后用圆滑曲线将各点连接起来,就得到频率分布曲线(见图7-9)。如果采用概率格纸按上述方法绘图,则频率分布曲线展为直线(见图7-10)。第四步是利用频率分布曲线求出lgMe和 σ。频率分布曲线上累积频率为 50% 的点,所对应的横坐标为 lgMe,而累积频率为 9% ,1% 的点,所对应的横坐标为 lgMe- σ,lgMe+ σ。故可求出 σ。在图7 9和图 7 10 上求得:lgMe= 91; σ = 20。第五步是求出背景值和异常下限。本例求得(10- 6):Co= 13; T = 42。图7-9 中位数与标准离差图解法示意图图7-10 中位数与标准离差图解法示意图
从统计学的发展趋势谈统计教育的改革 摘要:要培养出新型的21世纪的人才,统计教育必须高瞻远瞩。本文从统计学的发展趋势谈了统计教育急需改革的几个方面。关键词:统计学;发展趋势;统计教育改革 随着国家创新体系的建立,统计创新工程已经提上议事日程