该文为测试相关学年毕业论文范文,与大学英语网络测试的信度与效度相关毕业生论文网,可作为大学毕业论文专业测试论文写作研究的大学硕士与本科毕业论文开题报告范文和职称论文参考文献资料。免费下载教你怎么写测试及考试及测验方面的优秀学术论文范文。
0 引言
2008年,教育部实施大学英语四级机考试点改革.从此,大学英语四级无论是从形式上还是从内容上都有了较大的变化.由于整个社会对大学英语四级的认知度都比较高,而且考生只有在大学就学期间才可以参加这项考试.因此,各个学校的大学英语教学也纷纷以大学英语四级考试为目标,制定相应的教学计划,对教学活动进行调整.辽宁工业大学从2009年开始,进行大学英语网络测试实践以来,已经进行了23场全校范围的测试,参加人数超过了二万人次.目前,已经形成了较为完善的测试硬件系统,和较为成熟的测试机制与体系.
基于以上背景,本文通过分析辽宁工业大学英语网络测试的实施过程与结果,考察这项测试的效度与信度,为今后大学英语教学的组织与进行,大学英语网络测试的创新与完善提供相应的依据.
1.高质量考试的标准
大学英语四级考试是一项由专家团队精心打造的考试,经过多年的验证,被社会广泛认可,可以当之无愧地称作“高质量考试”.那么,辽宁工业大学的大学英语网络测试,是否也是一项“高质量考试”呢?
Bachman & Palmer将以下六大要素作为决定测试质量优劣条件,分别为信度(reliability)、效度(construct validity)、真实性(authenticity)、交互性(interactiveness)、影响性(impact)、可行性(practicality).所谓真实性,是指考生在测试过程中能够正确解答某个问题,是否等于其在实际场合下也具备与之相对应的能力.所谓交互性,是指考生在完成测试任务过程中个人特征的参与程度和形式.所谓影响性,是指测试对于这个社会、教育制度、或是此项制度中的个人所造成的影响,同时还包括测试的波及效应(washback effect).最后的可行性与前面几项要素不同,它包括测试以何种方式实施、甚至于最初的测试能否能够实施的问题.但是,正如Bachman & Palmer所说,决定测试质量的最主要因素应属信度和效度.
2.测试的信度
2.1 信度的概念
有关测试的信度,许多学者给出了它的定义.Bachman & Palmer(1996)将信度定义为“测试的一致性”,即具备从一次测试到另一次测试结果一致的机能.同样,McNamara(2000年)在其论著中提到,信度是由测试所得出的个人测试结果的一致性,通常用信度指数表示.最后,Alderson et al. (1995年)说,测试的信度是指测试得分的一致性.信度高的测试,应试者在应试当天和第二天会得到相同的测试结果.
综上所述,所谓信度可以定义为,测试得分一致性的程度.如果某个应试者为检验某项能力而参加测试,其在任何时间、任何地点、任何条件下所得出的结果都是一致的,那么我们就可以认为这项测试是有信度的.
2.2 信度的测定
许多研究者对测试信度的测定方法进行了研究,其中有代表性的方法为以下四种:
1)重测信度:用同一种测验,对同一组被试,前后施测两次,再根据被试两次测验分数计算其相关系数,即得重测信度.这种信度能表示两次测验结果有无变动,反映测验分数的稳定程度,故又称稳定性系数.
2)复本信度:复本信度指的是两个平行的测验测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数.
3)分半信度:分半信度指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度.
4)同质性信度:同质性信度也叫内部一致性系数,它是指测验内部所有题目间的一致性程度.根据Hughes(1989年)的观点,第三种方法也属于此类.
3.测试的效度
3.1 测试效度的定义
效度的定义到底是什么,这里讲迄今为止有关学者的代表性论述按时间顺序作以总结.1985年由美国心理学会(APA)、美国教育研究协会(AERA)和美国国家教育测量协会(NCME)共同编制的《教育与心理测验及手册的标准》第一章中,对测试效度做了定义.其中,效度反映已有证据(evidence)可以在多大程度上支持根据测验分数所做出的推论.根据证据来源不同,证据被划分为来自构念(construct)、来自内容和来自标准(criterion)三种,效度也被相应地划分为三种.多年来,这种关于效度的定义和效度种类的划分,一直成为教育与心理测量学界关于效度研究的基本框架.
3.2 结构效度
有关结构效度的定义,很多的研究学者给出了比较复杂且相对不同的定义.首先Alderson,et al.(1995)将结构效度看作是“测试能够在何种程度上检测出某种特性或性质”.所谓的构成效度,并不是一个具体的东西,而是一个抽象的心理学概念.它所测试出的这种特性,是经过多次实际考试,综合分析考试结果与预测结果之后所得出的.
效度的概念曾经一度被划分为许多详细的分支,现在有有被众多学者的研究主流又转变为将其进行统一.本文之前所提到的,APA、AERA和NCME联合委员会的定义“Validity is a unitary concept.”换句话说,诸多被细分的效度概念我们可以用一个结构效度来统一联系起来.
3.3 效度的验证
目前,不同学者对结构效度的验证方法有着不同的见解.比如,L. J. Cronbach和P. E. Meehl提出了五种验证方法,即分组区分法(group differences)、相关矩阵与因素分析法(correlation matrices and factor analysis)、内部结构研究(studies of internal structure)、不同场合下的变化研究(studies of change over occasions)、过程研究(studies of process). 但是,大多数人都将《教育及心理测试标准》一书中的定义 “试题的效度指证据和理论对测试分数解释的支持程度”作为理论依据.将试