摘 要:电脑自适应测试是一种先进的考试方式,目前主要应用于英语测试中,在计算机基础测试中的应用还属于空白。本文从考生的特质因素、题目数据库的建设、题目的质量参数值等方面对电脑自适应测试在计算机基础课考试中的应用方式方法作一般性阐述。
关键词:自适应;测试;特质;难度;区分度
1 引言
自适应测试是一种基于项目反应理论的测试方式,在考试过程中及时根据考生能力值和答题情况为该考生从题库中选取难度恰当的下一道题目继续测试,直到达到指定的精度或一定题量时为止。如此,以极少的时间和题量达到和传统测试相同的效果,大幅度节省资源。
每一个考生的答对率可能是一样的,但是由于高水平的考生回答问题的难度较大,因此,他的得分将会较高。计算机基础试题除了单选题、多选题、判断题等大众题型外,还有计算题、实验题、图形题等。因此无论在题库建设方面,还是在考试方式方面,都有其个性。
2 题库建设
题库的建设关系着自适应测试的成败,必须高度重视。
2.1 题库组织
(1)组织好命题队伍。命题人员应当是计算机基础教学的专业人员,熟悉计算机基础当前使用的教材和教学大纲,对计算机基础教学法与教学理论有较高的研究水平,掌握一定的考试理论和方法。
(2)在题目难度方面要展开,涵盖不同层次的考生,各个等级的题目数尽量均匀。此为要点,是自适应测试成功的关键之一。
(3)区分度值是衡量题目质量的重要指标,是题库建设的最大难点,是测试成败的关键之一。题目的区分度值越高,越能反映考生的特持水平。
2.2 题库结构
自适应测试涉及的数据表很多,但至少应包括题库结构表、题目表、题目使用情况表、学生登录表、学生答题表、考生记录表、题目关键词表、试题参数表等。
(1)题库结构表
字段题号题目题型答案难度区分度使用次数IRTa参数IRTb参数IRTc参数类型CCCCSSSCCC长度550330443444 (2)题目表
字段题号题目答案答案A答案B答案C答案D类型CCCCCCC长度5503030303030
3 考生特质水平的确定
3.1 罗杰斯蒂模型表达式
某一特质水平的考生,答对某一题目的概率遵循如图1所示的罗杰斯蒂曲线规律。由于考生做题时有猜测的因素,所以曲线的起点高度不是在0点而是在c点,c即猜度值。当测试人数小于600时,可令c=0。
罗杰斯蒂曲线有两种数学表达式,即
(1)
和
(2)
二者曲线形状基本相同,本文采用(1)式进行分析。
3.2 考生特质水平初值θ0
自适应测试的最大特点就是根据考生的能力提取相应难度值的试题,因此,必须首先确定考生的初始能力值θ0。先选用少量的CLOZE题(最多L=20道)作为初试,如果答对了m道题,则初始能力值为:
θ0=ln[m/(L-m)] (3)
3.3 考生特质水平θ的确定
设置一个变量U,当第i道题答对时,Ui=1,否则Ui=0,某位考生做了n道测试题。根据解似然方程,可以得函数:
(4)
对(4)求一阶导数,得:
(5)
利用牛顿迭代公式可以最后确定θ,即
θm+1=θm-hm (6)
其中,θm+1 、θm 为第m+1、第m次迭代后的能力值。hm=f(θ)/f'(θ)。
在实际应用中,将(1)-(6)用VB等程序语言编写成计算机程序,快速解出能力值θ。
4 题目难度值b的确定
参照能力值θ的确定方法,设有k人选择了第i道题目,由似然方程,得函数:
(7)
和:
(8)
利用牛顿迭代公式可以最后确定b值,即
bm+1=bm-hm (9)
其中,bm+1 、bm 为第m+1、第m次迭代后的难度值。hm=f(b)/f'(b)。编程序解出题目难度值b。
难度值分为五个级别,如表1:
难度级别很难较难中等较易容易难度值b0.90.70.50.30.1IRTb2.200.850-0.85-2.20 表1:难度值表
表中,IRTb=ln[b/(1-b)]。
5 题目区分度值a的确定
参照能力值的确定方法,由似然方程,得函数:
(10)
和:
(11)
利用牛顿迭代公式可以最后确定a值,即
am+1=am-hm (12)
其中,am+1 、am 为第m+1、第m次迭代后的区分度值。hm=f(a)/f'(a)。编程序解题目区分度值a。
区分度值分为五个级别,如表2:
区分度级别很难较难中等较易容易区分度值a105.02.01.00.5IRTa105.02.01.00.5 表2:区分度值表
表中,IRTa=a。
6 计算机基础试题题型的确定和试题的抽取
在计算机上进行计算机基础课程的考试,由于测试软件的限制,主要以客观题为主,如单选题、精确多选题、判断题、精确填空题等。而对于问答题、计算题、操作题等主观题在电脑上进行测试比较困难,为此,可以将主观题转变成为客观题。比如计算题,可以将结果做为选项供考生选择。
如果某道题有图形或图像,可以利用数据库的图形功能,也可以利用数据库与图形文件相结合的方法。后者更简单有效,但是需要在试题数据表中设置一个有否图形的字段,如果该题有图形则该字段为该图形文件的文件名,否则为空。
对于题目的抽取,首先确定题型的种类,假设有单选题、多选题、判断题、精确填空题、计算题五类题型,第一步根据考生θ0抽取相应难度的
单选题,做对升一级,直到做错或到最高级转入多选题;做错则降一级,直到做对或到最低级转入多选题。以此类推。
7 设计程序实现参数调整
a、b的初始值是由人工确定的,一般不精确,必须通过每次考试后采集数据利用程序语言进行调整,使之逐渐趋于真实值。人工调整极为耗时耗力,利用计算机语言分别解(4)-(12)式的三组非线性方程则实现了试题参数值的自动调整。
以难度值b的确定为例。首先确定选择了题目i的考生,再从第i题的IRTa、IRTb、IRTc中取出当前该题的a、b(作为难度初值)和c(如果测试人数少于600,可令c=0),即可确定难度值b。假设在学生数据表中有该生能力值ability字段和对第i题答题情况的U值字段,答对U=1,答错U=0,令c=0,用ASP.NET描述如下。
do while not rsrs.eof //对每一个选择了某题目的考生(共k名考生)进行操作
that=rsrs(“ability”)
a=rstk(“IRTa”)
b=rstk(“IRTa”)
U=rstk(“U”)
f1=0
f2=0 //f1的一阶导数
For i=1 to 10 //循环10次即可达到足够的精度
p=1/(1+exp((-1.702)*a*(that-b)
h=-p*(U-p)/(1.702*a*(p-1)(p*p))
b=b-h
next i
loop
考生特质能力θ值的调整与区分度值a的调整方法与此类似。
8 长文字题和图形题的操作方法
8.1 长文字题
当一道题的题干文字超过255个字节时,数据库报错。此时可以将文字写入写字板中,其文件名与数据表中的相应题目的编号相同,如某题目的编号为tk001012,则该写字板保存的文件名为当前目录下的cloze文件夹下的tk001012.TXT,按以下代码调用:
file1=right(rs(“编号”),6)
j=Server.MapPath(“clozetk”& file1 & “.TXT”)
file2=file.readalltext(j,Encoding.Default)
label1.text=file2
8.2 图形题
对于计算机基础课考试要考虑图形。可将图形设置成文件,文件名与数据表中的题号一致,如:
9 后记
自适应测试最关键之处在于难度值和区分度值的调整。本文阐述的调整方案实现了这两个参数的自动调整,为自适应测试方法的普及打下了一个良好的基础。每当一次考试完成以后,对本次考试所涉及的每道题进行一次调整,使得θ、a、b值趋于真实。
参考文献:
杨昱,王红艳.基于题库自适应在线考试系统的分析与设计.武汉理工大学学报,2008,4:158.