当前位置 —论文教学— 范文

关于计算机类论文范文参考文献,与计算机自适应性语言测试的智能选题方法*相关论文发表

本论文是一篇关于计算机类论文发表,关于计算机自适应性语言测试的智能选题方法*相关在职毕业论文范文。免费优秀的关于计算机及信息技术及计算机科学方面论文范文资料,适合计算机论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。

实测和结果处理三个逻辑过程(参见图3).


计算机自考专科毕业写论文怎么写
播放:27026次 评论:3631人

1.初测阶段(piloting)

CAT考试的精髓就是针对不同水平的考生提供不同难度的测验题目,因此初测阶段主要是对被试的语言水平进行初步的估计,以便判断考生在正式考试阶段首先作答的题目难度.在初测阶段,计算机CAT系统首先从题库中随机抽取少量(5-10个)的中等难度的题目让被试作答,同时计算机系统通过期望能力法(EAP)或最大似然估计法(MLE)对被试的水平进行在线(on-line)估计,从而判断正式考试阶段对每一个被试第一次呈现的题目难度.初测阶段的操作机制与眼科大夫根据国际标准视力表检查学生的裸眼视力时第一次选择辨别符号的方法一样.检查者首先让被试辨别几个代表中等视力的符号“E”,然后根据学生反应的正确情况再决定继续让被试辨别的视力符号的级别,这样不断循环,逐步逼近学生的真实视力水平后即可终止检查过程,从而可以在最短的时间内准确地判断被试的视力水平.

2.实测阶段(formaladministration)

CAT考试的实测阶段是考试的核心阶段.根据初测阶段的结果,计算机从题库中随机选择并呈现一个与被试初测水平

关于计算机自适应性语言测试的智能选题方法*的在职毕业论文范文
关于计算机类论文范文参考文献
最匹配的题目让被试回答,回答结束后,系统马上根据回答的结果判断下一个应该呈现的题目难度,并计算测验的信息函数值是否达到了终止测验的标准.测验的信息函数值(informationfunction)是反映测量准确性的关键指标,它是测验项目信息函数值的总和,其具体估计公式如下:

1(θ)等于

其中,P1i(θ)是Pi(θ)的一阶导数,Qi(θ)等于1-Pi(θ),据此,我们可以得出满足信息函数值最大化的项目与能力值之间存在如下关系:

θ等于b+loge

当Ci等于0时,在能力量表的bi点上,题目i提供的信息量最大,即当被试的语言能力水平与项目的难度值相当时,项目对被试的测量准确性最高.所以,在选择下一个测验题目时,如果被试答对了项目I(j),并且测验的信息函数值I(θ)还没有达到终止测验的标准,那么系统就会继续给被试随机提供一个难度更高(b值更大一点)的项目I(j+1);如果被试答错了项目I(j),系统则会为被试随机提供一个难度更低的项目I(j+1),并继续计算被试的反应结果和测验信息函数值,如此不断循环,直到满足结束标准(达到预先设置的信度要求)后,实测阶段即告结束.

3.处理结果(scoretransformationandreport)

CAT考试的最后阶段是在测验满足终止(end-up)条件后,首先对每个考生的能力估计值进行计算,然后进行分数转换,并给每个考生报告一个便于理解的标准化测验分数(standardizedscore)和测量的标准误(信度值),最后宣布考试结束.

三、CAT在阅读测验中的智能选题策略问题

阅读理解能力是一个人语言水平高低的重要标志,因此,国内外几乎所有的外语测试或第二语言测试都将阅读理解能力的测量作为考试的重要组成部分,而且基本上都是采用经典的篇章阅读测验方式对被试的阅读水平进行考查,即命题者首先选择若干适当长度的阅读材料(passages),然后针对每篇阅读材料命制适当数量的多项选择题让考生回答,从而通过考生对测验题目的回答情况推断其阅读理解水平的高低.

这种经典的测量方式可以比较准确、全面地评价考生的综合阅读理解能力,具有较高的构想效度(constructvalidity),因此在未来一个相当长的时间内,教育测量领域还无法找到其他替代的测量方式.不过,CAT考试中的即时能力估计和选题策略基本上都是以二分记分(dichotomous)模式的孤立测验项目为基础的,因此,在CAT测验方式中,就必然会面对这样一个特殊的困境:基于同一篇阅读材料命制的题束内测验项目之间的难度并不相同,如果仅以题目的难度参数作为标准选择题目时,不同能力水平的考生必然需要回答不同的测验项目,同时还必须让考生阅读相同的阅读材料,否则考生就无法对测验的题目做出回答.然而,考生对同一个题束内不同题目的回答,并不能完全反映考生对阅读材料的整体理解水平.另外,如果两个考生分别正确回答了一个难度指数相同、但属于不同文章的题目时,两者的阅读能力也不具有可比性.

所以,为了解决上述测量悖论,在以CAT方式对被试的阅读能力进行测量时,必须以整篇阅读材料为单位,而不是以其中的题目参数值为标准进行题目的适应性选择,否则在考试的可行性和能力的估计方面就会产生逻辑矛盾.目前,国外在实施计算机自适应性语言测试时,主要采用三种方法解决阅读测试的智能选题问题:一是计算机考试和适应性考试的混合设计方式;二是篇章难度系数控制法;三是借助题组反应理论(TRT)的固定路径法(fixedbranchingroutine)尝试解决上述问题,不过该方法目前还不能在CAT中进行实际应用.

1.混合设计模式

在绝大多数语言测试中,为了保证测验的内容效度和避免测验方法引起的构想无关变异(construct-irrelevantvariance),测验题目主要以客观性测验方式为主.所以只有在段落听力理解和阅读理解考试部分不得不采用题束方式.为了避免产生CAT考试中的上述选题陷阱,所以不少考试采用“CAT+CBT”混合设计的方式进行施测.在考试开始阶段,首先对考生进行基于CBT的阅读理解定长测验,然后再进行其他部分客观题目的CAT测试.这样,所有的考生必须阅读相同的阅读材料并回答相同的题目,计算机根据每个题目的参数,估计考生的能力和信息函数值.阅读理解测试结束后,再按照严格的CAT模式继续完成其它部分的测验.这样一方面可以充分发挥CAT的优势,同时又可以避免阅读测试中的题目选择问题.目前,“CBT+CAT”混合测量模式是国际语言测试的主流模式之一,其优点是效率高、可行性强,但缺点是两种测量模式的考试结果必须进行复杂的分数合成处理(Chalhoub-Deville,1999;Yang,2011).

2.篇章难度系数控制模式

篇章难度系数控制模式的CAT考试理论基础源自美国对英语阅读材料的易读度(readability)研究.1948年美国哈佛大学的语言学家和心理学家G.K.Zipf在对大样本语料库(corpus)进行统计研究和变量分析的基础上,提出了书面语言表达中的最省力原则,即:任何作者在用自然语言写作时,都会潜意识地在不违反语言篇章组织原则的前提下,使用尽量简单的词汇和简单的句法表达期望表达的意思,这也是后来被称之为齐普夫定律(Zipf’slaw)的精髓.齐普夫定律中的词频和句子复杂度是英语阅读材料易读度研究的基础.1995年,Stenner在齐普夫定律的基础上提出了蓝思文本难度计算公式(textdifficultyinLexile),并将其用于英语阅读材料的难度估计(Rover,2001).

Lexiledifficulty等于582-386*mean(ln(WF))+1768*ln(mean(SL))

该公式的基本含义是:文章的难度与文章中词频(WF)对数的平均值和平均句长(SL)(平均每个句子中的词汇数量)密切相关.词频越低、平均句长越长,文章的难度越高,即蓝思值越大,反之蓝思值越小.为了保证CAT语言测试中的阅读理解文章的选择&#

1 2 3

关于计算机类论文范文参考文献,与计算机自适应性语言测试的智能选题方法*相关论文发表参考文献资料:

实践教学论文

初中语文有效教学论文

小班幼儿教师论文

八年级生物教学论文

小学语文教学实录

师范英语毕业论文

师爱论文题目

音乐教师师德小结

计算机教学总结

什么是计算机辅助教学

计算机自适应性语言测试的智能选题方法*(2)WORD版本 下载地址