不是。
论文的表格里的数据是平均值加减标准差,不是标准误,论文的数据一般描述统计不需要加标准差,而推断性统计往往要以平均数作为反应数据的集中趋势,而用标准差反映数据的离散趋势,所以说通常要算标准差。
小伙伴们知道什么是标准差与标准误吗?这两者有何关系?有何区别?下面就跟着我一起来看看吧。
标准差与标准误关系与区别
在日常的统计分析中,标准差和标准误是一对十分重要的统计量,两者有区别也有联系。但是很多人却没有弄清其中的差异,经常性地进行一些错误的使用。对于标准差与标准误的区别,很多书上这样表达:标准差表示数据的离散程度,标准误表示抽样误差的大小。这样的解释可能对于许多人来说等于没有解释。 其实这两者的区别可以采用数据分布表达方式描述如下:如果样本服从均值为μ,标准差为δ的正态分布,即X~N(μ, δ2),那么样本均值服从均值为0,标准差为δ2/n的正态分布,即?~ N(μ,δ2/n)。这里δ为标准差,δ/n1/2为标准误。明白了吧,用统计学的方法解释起来就是这么简单。
可是,实际使用中总体参数往往未知,多数情况下用样本统计量来表示。那么,关于这两者的区别可以这样表述:标准差是样本数据方差的平方根,它衡量的是样本数据的离散程度;标准误是样本均值的标准差,衡量的是样本均值的离散程度。而在实际的抽样中,习惯用样本均值来推断总体均值,那么样本均值的离散程度(标准误)越大,抽样误差就越大。所以用标准误来衡量抽样误差的大小。
在此举一个例子。比如,某学校共有500名学生,现在要通过抽取样本量为30的一个样本,来推断学生的数学成绩。这时可以依据抽取的样本信息,计算出样本的均值与标准差。如果我们抽取的不是一个样本,而是10个样本,每个样本30人,那么每个样本都可以计算出均值,这样就会有10个均值。也就是形成了一个10个数字的数列,然后计算这10个数字的标准差,此时的标准差就是标准误。但是,在实际抽样中我们不可能抽取10个样本。所以,标准误就由样本标准差除以样本量来表示。当然,这样的结论也不是随心所欲,而是经过了统计学家的严密证明的。
在实际的应用中,标准差主要有两点作用,一是用来对样本进行标准化处理,即样本观察值减去样本均值,然后除以标准差,这样就变成了标准正态分布;而是通过标准差来确定异常值,常用的方法就是样本均值加减n倍的标准差。标准误的作用主要是用来做区间估计,常用的估计区间是均值加减n倍的标准误。
标准偏差反映的是个体观察值的变异,标准误反映的是样本均数之间的变异(即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度),标准误不是标准差,是样本平均数的标准差。 标准误用来衡量抽样误差。标准误越小,表明样本统计量与总体参数的值越接近,样本对总体越有代表性,用样本统计量推断总体参数的可靠度越大。因此,标准误是统计推断可靠性的指标。
在相同测量条件下进行的测量称为等精度测量,例如在同样的条件下,用同一个游标卡尺测量铜棒的直径若干次,这就是等精度测量。对于等精度测量来说,还有一种更好的表示误差的方法,就是标准误差。
标准误差定义
标准误差定义为各测量值误差的平方和的平均值的平方根,故又称为均方误差。
设n个测量值的误差为ε1、ε2……εn,则这组测量值的标准误差ζ等于:
(此处为一公式,显示不出来,你看下文字就可以知道这个公式是什么样的。)
由于被测量的真值是未知数,各测量值的误差也都不知道,因此不能按上式求得标准误差。测量时能够得到的是算术平均值(),它最接近真值(N),而且也容易算出测量值和算术平均值之差,称为残差(记为v)。理论分析表明①可以用残差v表示有限次(n次)观测中的某一次测量结果的标准误差ζ,其计算公式为
(此处为一公式,显示不出来,你看下文字就可以知道这个公式是什么样的。)
对于一组等精度测量(n次测量)数据的算术平均值,其误差应该更小些。理论分析表明,它的算术平均值的标准误差。有的书中或计算器上用符号s表示)与一次测量值的标准误差ζ之间的关系是
(此处为一公式,显示不出来,你看下文字就可以知道这个公式是什么样的。)
标准误差
需要注意的是,标准误差不是测量值的实际误差,也不是误差范围,它只是对一组测量数据可靠性的估计。标准误差小,测量的可靠性大一些,反之,测量就不大可靠。进一步的分析表明,根据偶然误差的高斯理论,当一组测量值的标准误差为ζ时,则其中的任何一个测量值的误差εi有68.3%的可能性是在(-ζ,+ζ)区间内。
世界上多数国家的物理实验和正式的科学实验报告都是用标准误差评价数据的,现在稍好一些的计算器都有计算标准误差的功能,因此,了解标准误差是必要的。
猜你喜欢
1. 论文写作常见统计学问题处理技巧
2. 关于体育统计学论文
3. 统计类论文投稿
4. sci论文写作解析
5. 医学论文表格的规范化标准
6. 医学论文写作格式
1. 标准误用来衡量抽样误差的大小和了解用样本平均数来推论总体平均数的可靠程度。
在抽样调查中,往往通过样本平均数来推论总体平均数,样本标准误 适用于正态或近似正态分布的数据, 是主要描述小样本试验中,样本容量相同的同质的多个样本平均均数间的变异程度的统计量。即如果多次重复同一个试验, 它们之间的变异程度用。显然它越小,样本平均数变异越小,越稳定,用样本平均数估计总体均数越可靠。因此,为说明它的稳定性、可靠性或通过几个对几组数据进行比较(这是科研论文中最常见的),应当用描述数据。实际应用中应该写成“平均数±标准误”或而英文表示为“Mean ±SE”的形式。
2. 标准误还可以进行总体平均数的区间估计与点估计(置信区间)。
根据正态分布原理,样本平均数?与标准误?合用还可以给出正态总体平均数的可信区间估计即推论总体平均数的可靠区间,例如常用“平均数±t0.05 (n-1)*标准误”? (其中t0.05 (n-1) 为样本容量是n的t界值)表示总体均值的95%可信区间, 意指总体平均数有95%的把握在所给范围内。
3. 标准误还可用来进行平均数间的显著性检验,从而判断平均数间的差别是否是由抽样误差引起的。
例如:某当地小麦良种的千粒重 =34克,现在从外地引入一新品种,通过多小区的田间试验得到千粒重的平均数 =35.2克,问新引进品种千粒重与当地良种有无显著差异?
新引进品种千粒重与当地良种有无显著差异实质是判断与的差别是否是有田间试验是抽样误差引起,所以要进行显著性检验,这里用t测验进行检验,所以认为新引进品种千粒重与当地良种千粒重的不同是由于田间试验是抽样误差引起,因此他们之间无显著差异。所以在进行平均数间的显著性检验是必须用到。