正态分布在教学评估中的应用

摘要：文章介绍了正态分布在教育研究中的应用：为科学地进行成绩分析、搞好教学评估,提供了可靠的依据。
关键词：正态分布成绩评定标准分0前言
传统的仅凭卷面分数和平均分数评估学生学习成绩和教师教学效果的方法，带有片面性。因此，诸如由学生各科卷面总分排名来评定奖学金，确定毕业分配时的优先分配政策，由主观制定的卷面分数段的比例大小和仅由平均分数的高低评估教师效果的好坏，是不合理的，本文给出一种新的评估体系供大家参考。
一、平均分数体现整体水平某班某学科的平均分数
x1=
2、求N个班某学科的平均分数应“加权”
x=
其中x表示加权平均数,ki表示第i班总人数,xi表第i班平均分数。
二、标准差反映平衡程度
除了解体现整体水平的平均分数外，还应了解每个人的分数离班平均分数的偏差大小。因此可以利用数理统计中的标准差计算公式
δ=
（其中x为卷面分数，x为平均分数，N为全班总人数）。例如，甲乙两班同一科的平均分数都是81.5分，标准差依次为9.2和10.3，从而知甲班比乙班要稳定些，发展平衡些。
三、“标准分”取代卷面分来评估每个学生学习成绩的总体水平
在评先、评优和奖学金中，常要比较学生成绩的优劣。例如：某班数学卷面平均分数为:x1=69.4，标准差为δ1=8.5。语文卷面平均分数为:x2=87.6,标准差为δ2=10.5。学生张某数学60分，语文94分。王某数学83分，语文68分，按传统的方法认为：张总分154比王151分多，因此张优先于王。这种评估是不合理的，原因是各科之间的卷面分数的参照点（零点）与单位都不同，不能相加求和来互相比较。
在现代的体育统计和有关统计文献中，都采用“标准分”（符号意义同上），即学生的成绩与班平均分之差比标准差。这样能统一尺度，具有合理的可比性。如张和王的成绩可以合理的评估如下(表1)：
表1
(注:习惯用正分,故一般取T=10Z+50,T分大约在20至80之间。它是把Z分扩大10倍，又往后平移50，消除了负数。)结果张两科总标准分95次于王97.3，与卷面分数结论相反，标准分反映学生在全体考分中的相对位置，故又称相对分。至于不同班级、不同学科的总分，由于试卷有难易之分等因素，更应采用标准分。
四、考试分数合理分布的评估依据
怎样评价一班的考试分数的分布是否合理，依据是什么？以前有关文献都认为:卷面分X是正态随机变量X～N（x,δ2），标准分Z服从标准正态分布Z～N（0,1）。但都没有加以论证或进行实际的统计分析。因此有些提法不尽妥当：因为样本平均分数x与样本标准差δ均为统计量，是随机变量，而正态分布的两个参数都是常数；如果X是随机变量,X～N（μ,δ12），X1，X2，∧XN是来自总体X的样本,则x是μ的无偏估计。δ是δ1的极大似然估计,一般地其观察值x≠μ,δ≠δ1,所以X～N（x,δ2）的提法不妥。而且也推不出Z～N（0,1）（证略）。
但是，通过多年来对我校各个教学环节情况比较正常的教学班的考试分数的统计分析发现标准分Z是近似服从标准正态分布的（有文献曾认为或假设Z近似地服从标准正态分布的说法）。由数理统计学可知：随机过程可以用族中的典型样本函数来表征。因此我们可以把Z近似地看作服从标准正态分布的随机变量，从而以标准正态分布作为评估学生考试分数合理分布的依据，根据“3δ”原则换算出标准分的合理分布评估依据：分段比例和累计比例。

（1）分段比例：
T≤20的比例为0.0013
40＜T≤60的比例为0.6826
30＜T≤70的比例为0.9544
20＜T≤80的比例为0.9974
T＞80的比例为0.0013
（2）累计比例：
T≤30的比例为0.0228
T≤40的比例为0.1587
T≤50的比例为0.5000
T≤60的比例为0.8413
T≤70的比例为0.9772
T≤80的比例为0.9987
记:│（取T≤20的人数／总人数）－0.0013│=A1
│（取T＞80的人数／总人数）－0.0013│=A2
│（取40＜T≤80的人数／总人数）－0.6826│=A3
│（取30＜T≤70的人数／总人数）－0.9544│=A4
│（取20＜T≤80的人数／总人数）－0.9774│=A5
则ΣAi=A1+A2+A3+A4+A5的值越小说明说明分布越合理。并在记分册中增加“平均分”，“标准差”，“标准分T”三栏，以方便教学管理部门进行评估。
五、统计分析实例
以我校2005级会计一班数学成绩为例见表得知（见表2，表3），是基本符合标准正态分布的。同时发现，越是成绩好的学生，各科卷面总分和标准总分排名基本相同，且各科成绩越平衡；越是各科成绩不平衡的，卷面总分与标准总分排名就相差较大（如第3，24，26学号），由此说明由标准分来评估学生学习成绩的总体水平是合理的科学的。
表2：分段比例对照

表3：累计比例对照

六、总结
通过以上讨论和计算，可以得出以下结论：在没转换成标准分之前，各科的分数是不能比较的。
2、用原始分高出平均分多少来衡量各科，也是很不科学的。
3、一旦转换成标准分，不但上述比较变得科学易行，而且各次考试之间也是应该比较的。如Z后次–Z前次=进步幅度。
4、平均分反映整体水平；标准差反映班级整体发展平衡程度；标准分反映学生个体各科发展的平衡程度。
4、分段比例和累计比例是学生成绩合理分布的评估依据。
5、统计数据与理论数据之差A1,A2,A3,A4,A5之和ΣAi是刻划合理分布程度的依据。
6、任何一次大型考试，不但要公布“平均分”，而且要公布“标准差”。这两个参数都是十分重要的。这样，各校，各班，个人在这个大系统中的地位都可以很容易的算出。
七、结束语
教学效果的评估，是“终端评估”，是教学管理的重要环节，它的合理性和准确度不但体现在变定性评估为定量评估，而且还依赖于教学“过程评估”的合理性。如试卷的难易程度，评卷的准确性与公正性，还有学生平时成绩的评定，考场纪律等。这都需要长期摸索和认真细致的统计分析。多年来，我们本着以抓“过程”保“终端”，以抓“终端”促“过程”的原则，在抓教学效果的评估的同时，在试卷评分方面也进行了一些改革和尝试，如运用美国数学教授T·L·Saaty提出的“层次分析法”和湖南农大的“加权评分法”，收到了一定的效果。
参考文献：盛骤.概率论与数理统计.北京:高等教育出版社,1998.
2、汪荣鑫.数理统计[M].西安:西安交通大学出版社,1987.
3、刘剑平.概率论与数理统计方法[M].上海:华东理工大学出版社,2001.