本论文是一篇关于评分方面论文摘要怎么写,关于基于多层面Rasch模型的大规模网上作文评分一致性检测相关大学毕业论文范文。免费优秀的关于评分及考生及参考文献方面论文范文资料,适合评分论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
摘 要:评分不一致是影响评分信度的主要因素.本文运用多层面Rasch分析软件FACETS对评分员在联网状态下作文评分的严厉度与内部一致性进行评估.根据拟合值和偏差值检测出评分不一致的评分员,后期将对他们进行再培训或予以更换,以此来保证大规模考试网上作文评分的信度.
关 键 词:多层面Rasch模型;FACETS;网上评分;信度
中图分类号:G42文献标识码:A文章编号:1009-0118(2013)02-0025-02
一、引言
随着互联网技术的深入应用,在语言测试领域,一种以计算机为基础的网上作文测试及人工阅卷的方法已经开始实施.与传统的阅卷方式相比,保证网上评分的一致性就成了一个亟待解决的问题.本文以湖南大学分级考试(简称CEPT)为例进行研究,使用FACETS(Linacre1999)试图研究两个问题:(一)分析影响大规模考试评分信度的因素及各因素之间的交互作用;(二)探讨如何使用FACETS检测评分一致性.
二、研究背景
(一)多层面Rasch模型用于信度研究
Linacre(1989)在Rasch的基础上提出了多层面Rasch测量(FACETS).它将影响考生得分的因素分为若干层面并将其参数化,这些层面参数相互作用,共同影响考生在某个题目上得分的概率.
在作文测试中,决定考生成绩的因素包括考生能力、任务难度和评分员的严厉程度.FACETS可以在同一洛基量表上对以上因素进行分析,找出各个方面的内部成分之间是否存在显著性差异.模型还可以进行拟合分析,从而反映成分的拟合程度.如评分员拟合值可以表示评分行为的内部一致性.通过分析,我们可以对评分员的严厉度和一致性有一个详细的了解.这也是本文要研究的主要问题.文中将会检测评分员的严厉度是否存在显著差异,评分员对评分标准的掌握是否会出现评分者效应和评分的趋中性、光环效应及偏差(Myford&Wolf,2003,2004).FACETS的另一重要功能是提供偏差分析,从而帮助判断两个方面之间是否存在交互作用.本文将利用这一功能研究评分员与写作任务之间的交互作用.
这篇论文转载于:http://www.sxsky.net/daxuebiyelunwen/05056975.html
(二)CEPT写作测试
目前高考实施各省自主命题,题目难度有所不同,考生的分数已不能完全地反映他们的能力,进入同一所大学的新生英语水平也存在显著差异.准确评估新生英语水平能够为大学英语教学提供科学依据.CEPT的目的是对大学新生的听、说、读、写能力进行系统全面的评估.根据测试成绩对学生进行分班教学,分数相当的学生分在同一班级,从而提高教学的针对性.
写作部分要求考生在30分钟内根据题目和相关提示完成一篇作文,题目由电脑从试题库中随机生成,考生的写作也要求在电脑上完成.
(三)CEPT作文评分的实施方法
与经典测量理论和概化理论相比,项目反应理论的优点之一是可以处理丢失的数据,每篇作文不需要所有的评分员都来评分(McNamara1996).作文评分采用交叉设计使得各个层面之间建立关联性(Linacre1989).本文采取