全面实施大学英语四六级网考任重而道远

2007年5月,教育部组织语言教学、语言测试和信息技术等领域的专家进行了论证,正式将"基于计算机和网络的大学英语四六级考试大型题库和考试系统建设"列入"高等学校本科教学质量与教学改革工程"项目."大学英语四六级网考项目的建设目标是提高大学英语四六级考试的效度和考务管理的效率"(金艳吴江2009).从国际语言测试的发展趋势来看,随着计算机和网络技术越来越多地运用于考试实施、评分和统计分析,测试的内容、形式、评分和成绩报道体系也更为完善.因此,对于提高考务管理效率这一目标,结果是毋庸置疑的.效度表示一项研究的真实性和准确性程度,又称真确性.它与研究的目标密切相关,一项研究所得结果必须符合其目标才是有效的.测试效度亦称测试的有效性,指一套测试对应该的内容所测的程度.也就是说,一套测试是否达到了它预订的目标以及是否测量了它要测的内容.四六级网考是否能达到它预订的目标,是否能全面测量它要测的内容,笔者对此尚有太多疑问.


一、如何合理安排考试的时间和地点

大学英语四六级网考项目的总体目标是建立"以试卷库为基础的计算机网络系统,尽可能在适当时间、适当地点为考生提供以听力测试为主包含说读写译在内,重点考查英语学习可持续发展能力的计算机考试"(张尧学2008.3).这里提到了"适当时间"、"适当地点".那么,什么时间是适当的时间,什么地点是适当的地点?按目前纸笔考试的规模统计,大学英语四六级考试一年的考生总数约为1600万.根据网考的系统设计原则,网考全面实施后,考点分布全国各地,1600多万学生将分散在一年中多个时间段里参加考试.考前考后的全部工作都要在规定时间内完成,其中包括报名、缴费、试题传输、考生答题、评分等.一年内要完成如此海量考生的考试,考点的分布必须有一定的广度和密度,考次的安排需要有足够高的频度.各个地区、各个院校可能因为计算机、机房、网络等硬件达不到系统所设定的标准,或者有些地区的院校硬件设备严重缺乏,因此而不能成为考点.所以一年要安排多少次考试,分别在什么时间什么地点安排,才能保证如此庞大的参考学生都有机会参加四六级的网考.此外,在硬件条件无法满足的地区和院校,如何使其学生有平等的机会和条件接受网考训练,比较方便地参加考试,这都是应该受到特别关注的问题.如果四六级网考依然采取的是现行的710分的评分方法,不设及格线,那么现行四六级考试模式下的产物"刷刷族"、"刷分大战"势必在网考中重演,那时候的年总参考人数会更多.这种情况下,又该如何保证考生能够公平公正地参与四六网考?

如果不能合理的安排考试的时间和地点,四六级网考就无法顺利地公平公正地进行,那么网考设计者所预订的目标和要测量的内容就无法实现,四六级网考的效度也就无从谈起.

二、如何保证四六级网考试题的测试信度

测试的信度也叫测试的可靠性,指的是测试结果是否稳定可靠.也就是说,测试的成绩是不是反映受试者的实际语言水平.测试的信度主要涉及到试题本身的可靠性和评分的可靠性者两个方面.试题本身是否可靠主要取决于试题的范围、数量、试题的区分度等因素,评分是否可靠则要看评分标准是否客观和准确.

四级网考考题分为三个部分:视听理解,视听综合(包括听写、跟读、总结和评论),阅读理解(包括快速阅读、仔细阅读、语法结构).其主要特点为:任务更加综合,听说读写面面俱到.四级网考增加了口语测试,加强了听力能力测试,而且听力素材丰富多样,都是从广播、电视、网络等媒体采集的真实材料.

前面我们提到,四六级参考人数庞大,要在几年时间所有地区所有院校配齐四六级网考所需的软硬件设施,然后像现行的四六级纸笔考试一样,一次性对所有考生进行网考,那无异于天方夜谭.为了解决这一问题,四六级设计者计划网考全覆盖后,在一年中进行高频次网考,且要确保测试信度.这就要求建立庞大的试题库.建立试题库首要问题就是组卷.设计者可以预先给定题型、数量、难易度、分支、时间等组卷参数,组卷方式可以采用"随机组卷与考生随机取题,随机生成固定试卷,人工自定义组卷"(周胜2008.12).组卷方式可以说是技术问题.那么在题目素材的选择上就不仅仅是单纯的技术问题.出题人员要根据给定的各类题型的参数,选取完全符合参数的素材,又要提供足够数量的试题,这与现行的一年两次,一次只选取一套试题的纸笔考试而言,任务的艰巨程度可想而知.大量的素材中,同类试题素材要保证近似的难易度,这给出题人员和审查人员都将带来极大的困难.

此外,四六级网考题型能最大限度实现机器自动评分.试点阶段测试的实验数据表明,人工评分和机器自动评分的相关性达到较理想的82%(宫力2009).尽管如此,产出性题型较适合考核语言综合应用能力,但不能采用机器自动评分,那么主观题的评分效率和信度如何,这也是有待解决的问题.

测试的信度与测试的效度有着密切的关系,一般来说,只有信度较高的测试才能有较高的效度.因此,如果无法确保四六级网考试题本身的可靠性和评分的可靠性,就会直接影响到四六级网考的测试效度.

三、四六级网考对教学产生怎样的反拨效应

反拨效应指语言测试对教与学带来的冲击和影响,同时还指语言测试对课程设置、教育者以及人才培养等所带来的不可低估的影响.任何一种考试都回对教学产生两种不同的反拨效应.一种是对教学起积极有益的促进作用,另一种是对教学产生消极甚至有害的反拨作用.2008年12月第一次四级网考试点考试已经实施,四级网考对教学的反驳作用也已经初现端倪.但是四六级网考究竟会对大学英语教学起到哪些正面和负面的反驳作用.目前为止,相关的理论研究为数尚少.

根据四六级网考设计的目的和意义,可以预见,信息技术与外语教学的结合势必带来语言教学的革命,从而改变传统的教学模式,促使课堂教学不再采用以书本为中心、以教师面授为主的教学模式,而是通过计算机网络化教学促成教师与学生的互动,学生与学生的互动,发展学生自主学习的教和学模式.从而进一步推进教学的计算机网络化.

然而这仅仅是我们从宏观层面上理想化的推测.四六级网考的反拨效应也是效度验证不可缺少的部分.由于缺少相关的研究,四六级网考将会对各个利益关系人(比如,考生、教师、学校、教育管理机构、用人单位)以及社会舆论和价值导向产生什么影响,影响的程度以及方向等问题,我们依然处于蒙昧状态.

以考生这一利益关系人为例.2011年上半年腾讯微博上做的一项调查显示:30.69%的人认为英语四六级是"大学魔咒,心中的痛",150.4%的人表示"考试无聊,测不出水平",只有19017%的网友认为"备考过程提高了英语水平"的积极观点.究竟是大学生的情绪浮躁,对待英语四六级的"态度不端",还是四六级"一考定等级"的制度太过武断,我们权且不作讨论.从这组调查数据中我们至少可以得到这样一个讯息:改革后的四六 级考试对学生并没有起到预期的积极的反拨效应.原来的60分及格线没有了,现在的425分诞生了;原来的"60分万岁"变成了现在"刷考族"反复参加考试以刷新自己的四六级成绩.调查显示,许多学生都认为,改革后的四六级增加了他们的心理负担.那么对学生的听说读写能力要求更高的四六级网考,对于考生来说是不是"旧伤未愈,又添新伤"呢?

上面讨论的仅仅是四六级网可能产生的反拨效应的一个小小的侧面.事实上,四六级网考产生的反拨效应是多方面,多层次的,也是十分复杂的.通过研究,尽量避免四六级网考可以预见的消极的负面的反拨效应,通过各种手段发挥四六级网考产生的积极的反拨效应,促进大学英语教与学整体上的良性运转,这是我们各个层次的教育工作者义不容辞的责任.

四、结语

以上三个方面笔者仅从十分浅显的层面对四六级网考的效度提出疑问.测试效度是一个统一的综合概念.测试效度的验证活动应该是多方位、多层次的.因此,除了以上提到的三个方面,四六级网考效度的验证活动还应包括网考所测的能力与纸笔考试有何差异,网考是否有助于提高测试的准确度,考生对测验题目和任务的反应情况等等.总而言之,对于四六级网考的效度研究任重而道远.实现四六级网考的全覆盖,笔者认为当前跨出得只是"万里长征的第一步".

类似论文

关于加强大学英语四六级考试考务管理工作的

摘 要:大学英语四六级考试是一项全国性的英语水平考试 本文通过对大学英语四六级考务管理工作的分析,对完善大学英语四六级考务工作。
更新日期:2024-3-3 浏览量:12323 点赞量:4869

大学英语四六级机考改革

【摘 要 】随着大学英语四六级机考试点学校的不断增加,四六级机考已经成为必然的发展趋势 本文重点讲述机考的特点及优势,以。
更新日期:2024-12-3 浏览量:20152 点赞量:5495

大学英语四六级考试改革的5I模型

[摘 要 ]大学英语四六级考试对于在校大学生的重要性不言而喻,在考试的过程中显露出来的各种弊端造。
更新日期:2024-3-8 浏览量:11014 点赞量:4030

大学英语四六级机考改革

【摘 要】随着大学英语四六级机考试点学校的不断增加,四六级机考已经成为必然的发展趋势 本文重点讲。
更新日期:2024-6-16 浏览量:80768 点赞量:17809