高中英语词汇测试的设计与评估

教学案例

高中英语词汇测试的设计与评估

王莉晖1 刘志辉2

(1.广东省顺德职业技术学院外语系 广东佛山 528300; 2.湖南省湘南学院外语系 湖南郴州 423000)

摘 要:本文根据2005年高考英语考试大纲词汇表,设计出一份词汇测试题,并进行了测试;然后,从信度、效度、可操作性、反拔作用等四个方面对其结果进行了评估。

关键词:词汇诊断性测试 词汇测试设计与评估 信度 效度 可操作性 反拔作用中图分类号:G42文献标识

码:A文章编号:1673-9795(2009)05(c)-0086-03

在我国,高考英语(NMET)占据着举足代表它所要测量的目标。它可以从三个方轻重的地位。词汇作为英语学习的重中之面进行判断:重,在复习中备受关注。在亓鲁霞(2004)的(1)测试内容是否和测试目标有关;一次访谈中有一位教师详细地谈到一种复(2)测试内容(试题)是否具有代表性;习词汇的方法:“最重要的是背单词。我每(3)测试内容是否适合测试对象。

年都把NMET考试大纲的单词印发给学因此,如何才能保证测试具有较高的生,要他们背,然后测试。我给出100个英语效度呢?首先,在设计测试之前,测试设计词,要他们写出汉语意思,再给100个汉语者应该规划出一份测试规格表,清楚、简洁词,要他们写出英语词。每周考。”

地描述遵循考试大纲、教学内容及教学目相信许多高中英语教师都有过同样的标的考试语言技能和范围,越具体越好,然经历,但亓(2004)明确提出“这种做法重知后按照表格,生产试题;其次,在完成试题识,轻运用,而且孤立地操练词汇,完全忽制作之后,交给有经验的老师或专家检验略语言交际功能,有悖于NMET设计者的一下试题。意图”。作为英语教育工作者,能否设计出Hughes(1989:22)指出测试只有包含与一份较为合理的词汇测试卷呢?让我们先测试目的相关结构的抽样项目,才具有内从理论上得到一些启发和指导。

容效度。为了保证内容效度,我们需要一份有关技能和结构的规格表,比较测试规格1相关语言测试理论

表和测试内容是判断内容效度的基础。1.1内容效度和表面效度

1.2信度一般来说,测试的效度是指测试或测Heaton(1988)声称信度是任何好的测试试的任何组成部分在多大程度上考了目的的必备特征,测试作为测量工具必需首先是所要考的 (Henning 1987:89)。简单地说,值得信赖的。Bachman(1996)把信度理解为考试的效度是指在多大程序上测出预期要测量的一致性(consistency of measurement),测量的东西,而非其他。效度概念包含了两测试分数的不一致是由于没有测到我们想层含义:一是考试究竟测量的是什么要测的结构的因素造成的。李筱菊(2001:(what);二是测出的程度有多大(how well)。34)认为对信度的更严密的定义应该是:测每项测试,无论长或短、非正式的课堂测试试的信度,指它的结果分数对受试者的表或公众测试,测试者都应该尽量使之有效现而言的可靠程度。考试的信度要高,靠三度。测试应该把对要测的特殊技能提供一方面的保证:种真实测量作为最终目标,如果测试同时(1)试题保证。量:试题要有足够的量。测量不相关的知识或其他技能,它就不会从理论上说,题越多,抽样越大,信度就越是一个有效度的测试(Heaton 1988:15)。

高。质:考试结果的分数要具有人分散度。语言测试专家对效度的分类众说纷分数分布正态,说明它反映了人的能力分纭,对已提出的各种效度的理解也不完全布实况,说明考试有信度。要达到分数有人一致。Heaton(1988:159~161)认为效度分分散度,试题要区分度高、难度适中、不要为表面效度(face validity),内容效度(content有偏颇性、试题适宜于要考它的受试群及validity),结构效度(construct validity),实验受试群适宜试题、整套试题应该属同一性效度(empirical validity)。许多测试专家认为质即同属一个范畴的东西。表面效度与内容效度无甚区别,但本人还(2)实施的保证。考试实施的各种条件,是趋向李筱菊(2001:41)对表面效度的定对所有受试者应当一致。义,它是指考试到了受试者手上,是否使受(3)评分的保证。要求评分员与评分员试者觉得它是一份有效的考试,如果考试之间保持一致,也要求每个评分员自身保者带着一种不良的情绪去应考,考试的效持前后一致。度就受影响。

对考试信度的验证,有一系列的方法:刘润清和韩宝成(1991:208~9)认为内考后复考法、试题分半法、平行试题法等容效度是指测试是否考了考试大纲规定要等。这些方法只是在一种考试开始建立时考的,或者说,考试的题目在多大程度上能

采用。此文检验考试信度的方法为试题分

半法,这种方法特别用于试题同质性的验证。最常计算并公布的有关考试信度的数

据包括:(1)用信度公式直接算出信度数据。(选自Heaton,1988,第164页)N表示测试中的题目数量;m表示所有测试者的平均分数;x表示所有测试者成绩的标准差;R11表示信度。(2)考试成绩正态分布的数据及分布图。

(3)题目分析(item analysis),这包括试题的难易度数据、区分度数据等。(4)有关评卷员评卷一致性或不一致性调整的数据。(5)试题偏颇性分析数据。(6)考试题目适宜性及人适宜性分析数

据。最后,需要指出的是信度和效度之间的关系既相互依存又互相排斥,故此,测试者得不断在保全一方损失另一方之间权衡(Hughes 1989:42)。2.3考试后效测试对教和学的影响被称为后效或或“反拔效应”(wash back)。Hughes(1989:1)声称后效可能是消极的,也可能是积极的。亓鲁霞(2006)也指出影响有

积极消极之分,大小之分,或促进或阻碍教学。人们要搞好教学就不得不关注考试的影响或后效。因此,怎样才能获得有益的反拔作用呢?Hughes(1989:44~47)提出一些建议:测试你想要鼓励学生发展的能力;测试样题的广泛性和不可预见性;使用直接测试;使用标准参照测试;建立在教学目标上的成绩测试;确定学生和老师熟悉测试内容题目类型;计算成本等等。

1.4可操作性Hughes (1989)认为检验测试的质量继

信、效度之后,就是可操作性。一次好的测试应是容易构建、管理、打分和解释且成本低廉。按照Hughes的观点,在设计测试前需

问这样一个问题:没有达到良好反拔效应的测试成本会是多少?一个可操作性的测试在设计、发展及使用时不应超过可支配的资源。这些资源包括:人力、物力、财力和

“反拔作用”

教学案例

时间。所需资源要随情况的改变而不同。考虑测试的操作性很有可能影响我们在测试发展和使用过程中每一个阶段的决定,这些都会使我们重新考虑和修改最初制订的规格表(specification)。1.5写题的指导方针

为了确保测试的信效度,出题者应该了解一些写题的指导方针。对单项选择题(MC),李筱菊(1997:158~218)提出了三条技巧和九条要求。三条技巧包括:利用目标语学习者的典型弱点;利用对词语的误解或错误联想;利用近似词语之间的混淆。九条要求是:语言正确、地道、得体、简洁;避免偏颇性;考点明确;每题只有一个答案;选择项不应互相牵连;选择项尽可能一致;避免无意中透露了答案的线索;干扰项都应有似乎可能性;避免出轨题。

除此之外,还有一些实用性手段,如:避免选项词的重复、避免否定词(如用时,把它突显出来)、避免使用只有对与错的判断题、避免使用“all of the above”选项;按字母、数字等适当的顺序排列选项;按从易到难的顺序排列试题;答案要有随机性。

受试者:此测试用于刚刚学完教学大纲所要求掌握的词汇的高中三年级学生,也可适用于想了解自己掌握多少高中词汇量的英语学习者。

题量和时间:它由10大题组成,共96小题(因所抽样词中有1对同义词,1对反义词,3个相关的词,故题量少于100题)。测试时间共为50分钟。

3对测试的分析评估

考虑此词汇测试的目的和构建,本文从四个方面对它进行评估:信度、效度、可操作性、反拔作用。具体地说:(1)分析此测试是否测到所要测的受试者的语言能力;(2)分析测试成绩的一致性;(3)评估它的制作过程是否简单易操作,成本是否低廉;(4)对受试者及教师有什么样的反拔作用。3.1测试效度评估

3.1.1受试者

30位同学参加了此测试,他们是广东省顺德区某一中学的高三学生。他们已学完所有大纲中的英语单词。要求他们在50分钟内完成96个小题。

3.1.2抽取样词

2词汇测试设计为了能够全面测试大纲中的词汇,本2.1测试构建的定义文采取了随机抽样的办法。Heaton(2000:52)

由于这项测试为诊断性学业成就测指出测试词汇要避免测试语法结构。刘和试,必须基于大纲。根据《全日制高级中学韩(1991:91)也指出词汇测试应集中测试词英语教学大纲(试验修订版)》(2005年)(以下意,如果测试中含有语法题,则违反了测试简称《教学大纲》)对词汇的教学目标和要效度。因此,为了保证测试的效度,排除一求:掌握1200个词和一定数量的习惯用语些语法功能词,如“a”、“the”、“in”等,剩下及固定搭配,要求能在口笔语中运用。此1869个实义词,然后对其进行编号。使用随外,还要学习750个左右单词和一定数量习机抽样表选取100个有效数字(≤1869)。如惯用语及固定搭配,只要求在语篇中理解下一组数据为随机抽样表的一部分数据(*其意义。按《教学大纲》的要求,对1200个词号的数字为有效数字):7728  5351  7992要求做到拼写正确、了解其意思并会运用,*0426  7581  6767  3683  7471  *1159另750个词只要在语境中看到能识别其意8166  4335  2064。思即可。3.2测试信度评估2.2规格表3.2.1词汇测试总成绩描述

内容:从《高考英语考试大纲词汇》(余数据分析使用SPSS 12.0。从结果可得心力等,2005)随机抽样选出100个英语单知,偏态值为-0.670,属于负偏态,表示分词。需指出的是,试卷中出现的所有单词均数分布曲线的峰偏向了右边,也就是偏向为教学大纲范围内单词。了高分,即:得分高于规定平均分的人数,

目的:通过此词汇测试,帮助教师了解超过了50%。学生也让学生自己了解自己掌握大纲词汇一般来说,一个考试偏态值和峰值能的数量情况,从而帮助师生制定或调整高控制在±1之内,便算其分数基本符合正态考英语复习计划。分布(李筱菊,1997:97)。显示平均数约为

69,中位数为73.5,众数为78,表明分数其中在70~80之间。这个结果对于教师来讲,是比较理想的。

3.2.2信度评估

结果得出内部一致性即同质性信度α=0.765,李筱菊(1997:100)认为理想的α值要求达到0.8,故内部一致性不是特别理想。因此,某些题需要修改,题的干扰项设计的不太合理,也可能某些题干没给予受试者足够的信息,使其得出正确答案。3.3可操作性评估

此次测试从设计和使用两方面来看,可操作性较强。资源极易获得,如NMET词汇大纲,随机抽样表。设计题干时,可利用字典、词汇书、英语国家语料库(BritishNational Corpus,http://info.ox.ac.uk/bnc/what/index.html)中的例句,也可自己编写,然后请外籍人士审阅。50分钟的测试时间使老师可选择在任何一节课堂上完成。所以,无论从人力、物力、财力及时间各方面来看,都是可控的。3.4反拔作用的评估

通过考试的结果,老师可清楚得知13.3%的学生达到80分以上的要求。它提醒老师要进一步加强学生词汇的复习和掌握。每位学生也可通过成绩了解自己掌握了多少个大纲要求掌握的词汇,进而更加合理地安排自己的高考英语复习计划。从这个意思上讲,它的反拔作用是积极的。

本次测试另一个反拔作用就是对学生学习策略的积极影响。John Read(N.Schmitt,M.McCarthy ed.,2002:307)提出缺乏语境的测试题将诱使学生只学习单词表,而不愿采用其他的学习策略。Ahmed(N.Schmitt & M.McCarthy ed.,2002:202)通过研究发现好的英语学习者采用多种多样的学习策略,而弱的英语学习者学习策略单一。因此,培养学习者多种学习策略是学好英语的关键。Part1&2&5,学生从一组单词中分辨出一个与所给词语义关系相近,相反或与其他三个单词不同的单词,可以促使学生养成建立英语词汇间联系的学习习惯。据日本的一项研究(同上:221)表明最有用的巩固词义的策略是“双语词典”、“笔头重复”、“口头重复”、“大声朗读单词”、“学习单词拼写”、“记课堂笔记”,由此看出,学习单词拼写是有助于记忆词意。Part4、part8、part10鼓励学生重视单词拼写,尤其是在多项选择题盛行的情况下。Part6&8的突出优势是使学生及早地养成用英语解释词语的习惯,能够用英语解释词语就减少看英文时先转换成汉语的翻译过程,对学生英语阅读能力的发展非常有益(武,2002:74~75)。Part7&9&10通过上下文来测试单词,培养学生通过上下文猜测词义的能力。

(下转89页)

教学案例

造一定的朗读情境,激发学生的朗读兴趣,在的联系,组合的结果,可以使体验阅读教使学生更好地感悟课文的情感主旨。如学学过程完整而又符合教学规律,有利于调习课文《贝多芬传》就很有必要聆听一下动学生的积极性,使之主动参与,合作学《命运交响曲》,领悟“命运在敲门”的韵味;习,不断发展,获得语文智能和身心素质的学习课文《始终眷恋着自己的祖国》可以唱全面发展。一下国歌,体验爱国情怀等等,这些都有助于学生对课文思想内涵的把握和体会,使3体验式阅读教学的配套策略学生得到思想情感的熏陶和感染。3.1提出并力行一些基本原则

积累,体验生活。通过阅读体验,逐步积体验阅读不是任意的,而是基于严谨累词汇、积累知识、积累技巧方法,这是符的计划、符合规律的要求和必要的原则。其合语文学习的认知规律的。阅读中的积累中,需要遵循并力行的基本的教学原则应环节,也具体地承担了这个任务。如《孔乙该包括:开放原则、观点广泛原则、合作性己》一文中,孔乙己两次付钱,作者用两个原则、实践性原则等,力求体验阅读符合教不同的动词,一“排”一“摸”形成了鲜明的学规律和认知规律。例如观点广泛原则,就对比,学生通过阅读比较探究,体验排、摸应该允许学生的不同观点和意见,即使对的具体情形,可以体会和认识作品遣词用《周总理,你在哪里》无法引起共鸣,也不必句的精妙。苏版教材的多篇课文,都可以让勉强;觉得《海燕》重复罗嗦,也应该鼓励其学生在朗读中揣摩,怎样合理地变换语气大胆质疑的精神。的轻重、语速的缓急、停顿的长短等,以表3.2建立阅读常规现各种心理情状和思想情感。这样,在朗读建立阅读教学常规,规范学生阅读行体验中走进课文展现的艺术世界,感受故为。习惯作为一种动力定型,是在多次实践事情节,体验作品的思想内蕴,也为生活积或重复练习中形成的,其中离不开一定外累经验。部条件的制约和影响。建立阅读教学常规

实践,体验创新。体验式阅读教学,当然就是要制约学生的阅读行为,使正确的阅必须突出实践活动。具体的实践,可以是学读行为得到重复练习,得到强化,趋于稳生外出参观体验,也可以是模仿课文写作,定,也就是“习惯成自然”;同时又摈除那些还可以是阅读后的上网材料收集,即使是不合规范的不良阅读行为。由于良好习惯阅读过程中的对比质疑,也算是一种体验,是习得的,并非一朝一夕能够养成,因而更例如有学生在阅读《醉翁亭记》的时候,认重要的是要长期坚持这些阅读教学常规,为“负者歌于途,行者休于树”应该改为“负严格要求学生坚持不懈地实践。著名特级者休于树,行者歌于途”,这样更合乎情理。教师魏书生就很重视阅读教学常规的建这就是体验以后的一种创新,类似这种有立,如规定每个学期开学前学生通读新的价值的探究,教师应该特别予以肯定。语文课本,完成固定的作业;又如读一篇课

这四个环节既可以独立操作,又有内文要求学生按“四遍八步读书法”进行阅

读。他对每一届学生都制定了语文教学常

规,并始终如一地坚持执行,使学生形成了习惯。

3.3教师必须身体力行,主动体验

体验式阅读教学,实际上对教师提出了更高的要求,教师必须时刻关注学科发展前沿和方向,不断充实和更新教学内容,充分调动学生的主动性、积极性,启发学生探求未知世界的兴趣。教师身体力行,有了满桶水,才好提供给学生源源不绝的活水源泉。特别是在阅读方法上尝试,得出可行性的方案,再用以指导学生,效果就很好。如精读、略读、浏览、默读、朗读、勾画圈点读书法、生疑发问读书法等等,这些都需要教师先行尝试乃至于熟练,才能指导学生使用。

4结语

总之,实施体验式阅读教学,能使学生成为课堂的主角,学生在自主阅读、合作互动中逐步建立起基于教师指导下的探究式的学习模式,培养提出、解决问题的能力和合作精神,锻炼表达和思辨能力。通过体验式的阅读,学生不仅可以学到一般的科学知识和方法,更可得到严谨治学、探索精神的历练。

参考文献

[1]赵毅.语文探究性教学的策略[J].中学

语文教学参考,2003(10).

[2]王小萍,在欣赏中阅读,在阅读中欣赏

[J].语文学刊,2005(24).

(上接87页)

4结语

英语词汇知识是各项英语语言技能发

展的基础。词汇知识积累直接影响学生英语交际技能的发展。死记硬背相互毫无联系的单个词汇不是有效的学习方法。本文尝试设计一份较能产生积极反拔作用的词汇测试题,不仅可以帮助教师及同学们了解自己掌握大纲的词汇现状,也希望藉此帮助学习者培养多种学习策略。本文从四个方面评估了此份测试题,了解到本测试的内部一致性不是很理想,需要进一步对测试题做项目分析。

[3]

[4]

[5]

参考文献

[1] Bachman,L.F.,and A.S.Palmer.Lan-

guage Testing in Practice[M].OxfordUniversity Press,Shanghai:ShanghaiForeign Language Education Press,1996.[2]Heaton,J.B.Writing English Language

Tests(New edition)[M].Beijing:Foreign

[6][7][8]

Language Teaching and Research Press,

2000.

Henning,G.A Guide to LanguageTesting:Development,Evaluation andResearch[M].Foreign Language Teachingand Research Press,2001.

Hughes,A.Testing for LanguageTeachers[M].Cambridge UniversityPress.Beijing:Foreign Language Teach-ing and Research Press,2000.

Schmitt,N.McCarthy,M.(ed.).2002,Vocabulary:Description,Acquisition andPedagogy[M].Shanghai:Shanghai For-eign Language Education Press,2002.李绍山.语言研究中的统计学[M].西安:西安交通大学出版社,2001,2.

李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,2001,2.

刘润清,韩宝成.语言测试和它的方法[M].北京:外语教学与研究出版社,1991.

[9]亓鲁霞.论考试后效[J].外语与外语教

学,2006,8:29~31.

[10]亓鲁霞.NMET的反拔作用[J].外语教学

与研究,2004,5:357~362.

[11]武尊民.英语测试的理论与实践[M].北

京:外语教学与研究出版社,2002.

[12]余心力,陈鸽,张乃鑫.高考英语单词排

名记忆宝典[M].北京:知识出版社,2005.

高中英语词汇测试的设计与评估

作者:作者单位:刊名:英文刊名:年,卷(期):

王莉晖, 刘志辉

王莉晖(广东省顺德职业技术学院外语系,广东佛山,528300), 刘志辉(湖南省湘南学院外语系,湖南郴州,423000)

中国科教创新导刊

CHINA EDUCATION INNOVATION HERALD2009(15)

参考文献(12条)

1.Bachman L F;A S Palmer Lan guage Testing in Practice 19962.Heaton J B Writing En glish Lan guage Tests 2000

3.Henning G A Guide to Lan guage Testing:Development,Eval u a tion and Research 20014.Hughes A Testing for Lan guage Teachers 2000

5.Schmitt N;McCarthy M 2002,Vocabulary:Description,Acquisition and Pedagogy 20026.李绍山 语言研究中的统计学 20017.李筱菊 语言测试科学与艺术 20018.刘润清;韩宝成 语言测试和它的方法 1991

9.亓鲁霞 论考试后效[期刊论文]-外语与外语教学 2006(08)10.亓鲁霞 NMET的反拔作用[期刊论文]-外语教学与研究 2004(05)11.武尊民 英语测试的理论与实践 2002

12.余心力;陈鸽;张乃鑫 高考英语单词排名记忆宝典 2005

本文读者也读过(9条)

1. 徐晓光 英语阅读理解应试理论探析[期刊论文]-山东师范大学外国语学院学报(基础英语教育)2003(3)

2. 张亚兰.周侠.刘彦峰.ZHANG Ya-lan.ZHOU Xia.LIU Yan-feng 英语语言测试设计原则简论[期刊论文]-甘肃联合大学学报(社会科学版)2007,23(6)

3. 付祥芝 英语教学测试设计[期刊论文]-信阳农业高等专科学校学报2002,12(3)4. 单满菊 试论三种常用英语测试题型及其优劣性[期刊论文]-平顶山师专学报2004,19(1)5. 刘肖沛.Liu Xiaopei 语言测试的类型与原则[期刊论文]-青岛远洋船员学院学报2001,22(1)6. 姚菲 英语练习的有效设计与科学讲评[期刊论文]-考试周刊2010(56)

7. 张丽华 中考英语听力典型题型设计与说明[期刊论文]-黑龙江教育(中学教学案例与研究)2009(5)8. 崔国艳 词汇习得方法实证研究的质量评估[期刊论文]-科教文汇2008(29)

9. 魏湘萍 测试考生综合能力的英语试题--完型填空[期刊论文]-龙岩师专学报2003,21(2)

引用本文格式:王莉晖.刘志辉 高中英语词汇测试的设计与评估[期刊论文]-中国科教创新导刊 2009(15)

教学案例

高中英语词汇测试的设计与评估

王莉晖1 刘志辉2

(1.广东省顺德职业技术学院外语系 广东佛山 528300; 2.湖南省湘南学院外语系 湖南郴州 423000)

摘 要:本文根据2005年高考英语考试大纲词汇表,设计出一份词汇测试题,并进行了测试;然后,从信度、效度、可操作性、反拔作用等四个方面对其结果进行了评估。

关键词:词汇诊断性测试 词汇测试设计与评估 信度 效度 可操作性 反拔作用中图分类号:G42文献标识

码:A文章编号:1673-9795(2009)05(c)-0086-03

在我国,高考英语(NMET)占据着举足代表它所要测量的目标。它可以从三个方轻重的地位。词汇作为英语学习的重中之面进行判断:重,在复习中备受关注。在亓鲁霞(2004)的(1)测试内容是否和测试目标有关;一次访谈中有一位教师详细地谈到一种复(2)测试内容(试题)是否具有代表性;习词汇的方法:“最重要的是背单词。我每(3)测试内容是否适合测试对象。

年都把NMET考试大纲的单词印发给学因此,如何才能保证测试具有较高的生,要他们背,然后测试。我给出100个英语效度呢?首先,在设计测试之前,测试设计词,要他们写出汉语意思,再给100个汉语者应该规划出一份测试规格表,清楚、简洁词,要他们写出英语词。每周考。”

地描述遵循考试大纲、教学内容及教学目相信许多高中英语教师都有过同样的标的考试语言技能和范围,越具体越好,然经历,但亓(2004)明确提出“这种做法重知后按照表格,生产试题;其次,在完成试题识,轻运用,而且孤立地操练词汇,完全忽制作之后,交给有经验的老师或专家检验略语言交际功能,有悖于NMET设计者的一下试题。意图”。作为英语教育工作者,能否设计出Hughes(1989:22)指出测试只有包含与一份较为合理的词汇测试卷呢?让我们先测试目的相关结构的抽样项目,才具有内从理论上得到一些启发和指导。

容效度。为了保证内容效度,我们需要一份有关技能和结构的规格表,比较测试规格1相关语言测试理论

表和测试内容是判断内容效度的基础。1.1内容效度和表面效度

1.2信度一般来说,测试的效度是指测试或测Heaton(1988)声称信度是任何好的测试试的任何组成部分在多大程度上考了目的的必备特征,测试作为测量工具必需首先是所要考的 (Henning 1987:89)。简单地说,值得信赖的。Bachman(1996)把信度理解为考试的效度是指在多大程序上测出预期要测量的一致性(consistency of measurement),测量的东西,而非其他。效度概念包含了两测试分数的不一致是由于没有测到我们想层含义:一是考试究竟测量的是什么要测的结构的因素造成的。李筱菊(2001:(what);二是测出的程度有多大(how well)。34)认为对信度的更严密的定义应该是:测每项测试,无论长或短、非正式的课堂测试试的信度,指它的结果分数对受试者的表或公众测试,测试者都应该尽量使之有效现而言的可靠程度。考试的信度要高,靠三度。测试应该把对要测的特殊技能提供一方面的保证:种真实测量作为最终目标,如果测试同时(1)试题保证。量:试题要有足够的量。测量不相关的知识或其他技能,它就不会从理论上说,题越多,抽样越大,信度就越是一个有效度的测试(Heaton 1988:15)。

高。质:考试结果的分数要具有人分散度。语言测试专家对效度的分类众说纷分数分布正态,说明它反映了人的能力分纭,对已提出的各种效度的理解也不完全布实况,说明考试有信度。要达到分数有人一致。Heaton(1988:159~161)认为效度分分散度,试题要区分度高、难度适中、不要为表面效度(face validity),内容效度(content有偏颇性、试题适宜于要考它的受试群及validity),结构效度(construct validity),实验受试群适宜试题、整套试题应该属同一性效度(empirical validity)。许多测试专家认为质即同属一个范畴的东西。表面效度与内容效度无甚区别,但本人还(2)实施的保证。考试实施的各种条件,是趋向李筱菊(2001:41)对表面效度的定对所有受试者应当一致。义,它是指考试到了受试者手上,是否使受(3)评分的保证。要求评分员与评分员试者觉得它是一份有效的考试,如果考试之间保持一致,也要求每个评分员自身保者带着一种不良的情绪去应考,考试的效持前后一致。度就受影响。

对考试信度的验证,有一系列的方法:刘润清和韩宝成(1991:208~9)认为内考后复考法、试题分半法、平行试题法等容效度是指测试是否考了考试大纲规定要等。这些方法只是在一种考试开始建立时考的,或者说,考试的题目在多大程度上能

采用。此文检验考试信度的方法为试题分

半法,这种方法特别用于试题同质性的验证。最常计算并公布的有关考试信度的数

据包括:(1)用信度公式直接算出信度数据。(选自Heaton,1988,第164页)N表示测试中的题目数量;m表示所有测试者的平均分数;x表示所有测试者成绩的标准差;R11表示信度。(2)考试成绩正态分布的数据及分布图。

(3)题目分析(item analysis),这包括试题的难易度数据、区分度数据等。(4)有关评卷员评卷一致性或不一致性调整的数据。(5)试题偏颇性分析数据。(6)考试题目适宜性及人适宜性分析数

据。最后,需要指出的是信度和效度之间的关系既相互依存又互相排斥,故此,测试者得不断在保全一方损失另一方之间权衡(Hughes 1989:42)。2.3考试后效测试对教和学的影响被称为后效或或“反拔效应”(wash back)。Hughes(1989:1)声称后效可能是消极的,也可能是积极的。亓鲁霞(2006)也指出影响有

积极消极之分,大小之分,或促进或阻碍教学。人们要搞好教学就不得不关注考试的影响或后效。因此,怎样才能获得有益的反拔作用呢?Hughes(1989:44~47)提出一些建议:测试你想要鼓励学生发展的能力;测试样题的广泛性和不可预见性;使用直接测试;使用标准参照测试;建立在教学目标上的成绩测试;确定学生和老师熟悉测试内容题目类型;计算成本等等。

1.4可操作性Hughes (1989)认为检验测试的质量继

信、效度之后,就是可操作性。一次好的测试应是容易构建、管理、打分和解释且成本低廉。按照Hughes的观点,在设计测试前需

问这样一个问题:没有达到良好反拔效应的测试成本会是多少?一个可操作性的测试在设计、发展及使用时不应超过可支配的资源。这些资源包括:人力、物力、财力和

“反拔作用”

教学案例

时间。所需资源要随情况的改变而不同。考虑测试的操作性很有可能影响我们在测试发展和使用过程中每一个阶段的决定,这些都会使我们重新考虑和修改最初制订的规格表(specification)。1.5写题的指导方针

为了确保测试的信效度,出题者应该了解一些写题的指导方针。对单项选择题(MC),李筱菊(1997:158~218)提出了三条技巧和九条要求。三条技巧包括:利用目标语学习者的典型弱点;利用对词语的误解或错误联想;利用近似词语之间的混淆。九条要求是:语言正确、地道、得体、简洁;避免偏颇性;考点明确;每题只有一个答案;选择项不应互相牵连;选择项尽可能一致;避免无意中透露了答案的线索;干扰项都应有似乎可能性;避免出轨题。

除此之外,还有一些实用性手段,如:避免选项词的重复、避免否定词(如用时,把它突显出来)、避免使用只有对与错的判断题、避免使用“all of the above”选项;按字母、数字等适当的顺序排列选项;按从易到难的顺序排列试题;答案要有随机性。

受试者:此测试用于刚刚学完教学大纲所要求掌握的词汇的高中三年级学生,也可适用于想了解自己掌握多少高中词汇量的英语学习者。

题量和时间:它由10大题组成,共96小题(因所抽样词中有1对同义词,1对反义词,3个相关的词,故题量少于100题)。测试时间共为50分钟。

3对测试的分析评估

考虑此词汇测试的目的和构建,本文从四个方面对它进行评估:信度、效度、可操作性、反拔作用。具体地说:(1)分析此测试是否测到所要测的受试者的语言能力;(2)分析测试成绩的一致性;(3)评估它的制作过程是否简单易操作,成本是否低廉;(4)对受试者及教师有什么样的反拔作用。3.1测试效度评估

3.1.1受试者

30位同学参加了此测试,他们是广东省顺德区某一中学的高三学生。他们已学完所有大纲中的英语单词。要求他们在50分钟内完成96个小题。

3.1.2抽取样词

2词汇测试设计为了能够全面测试大纲中的词汇,本2.1测试构建的定义文采取了随机抽样的办法。Heaton(2000:52)

由于这项测试为诊断性学业成就测指出测试词汇要避免测试语法结构。刘和试,必须基于大纲。根据《全日制高级中学韩(1991:91)也指出词汇测试应集中测试词英语教学大纲(试验修订版)》(2005年)(以下意,如果测试中含有语法题,则违反了测试简称《教学大纲》)对词汇的教学目标和要效度。因此,为了保证测试的效度,排除一求:掌握1200个词和一定数量的习惯用语些语法功能词,如“a”、“the”、“in”等,剩下及固定搭配,要求能在口笔语中运用。此1869个实义词,然后对其进行编号。使用随外,还要学习750个左右单词和一定数量习机抽样表选取100个有效数字(≤1869)。如惯用语及固定搭配,只要求在语篇中理解下一组数据为随机抽样表的一部分数据(*其意义。按《教学大纲》的要求,对1200个词号的数字为有效数字):7728  5351  7992要求做到拼写正确、了解其意思并会运用,*0426  7581  6767  3683  7471  *1159另750个词只要在语境中看到能识别其意8166  4335  2064。思即可。3.2测试信度评估2.2规格表3.2.1词汇测试总成绩描述

内容:从《高考英语考试大纲词汇》(余数据分析使用SPSS 12.0。从结果可得心力等,2005)随机抽样选出100个英语单知,偏态值为-0.670,属于负偏态,表示分词。需指出的是,试卷中出现的所有单词均数分布曲线的峰偏向了右边,也就是偏向为教学大纲范围内单词。了高分,即:得分高于规定平均分的人数,

目的:通过此词汇测试,帮助教师了解超过了50%。学生也让学生自己了解自己掌握大纲词汇一般来说,一个考试偏态值和峰值能的数量情况,从而帮助师生制定或调整高控制在±1之内,便算其分数基本符合正态考英语复习计划。分布(李筱菊,1997:97)。显示平均数约为

69,中位数为73.5,众数为78,表明分数其中在70~80之间。这个结果对于教师来讲,是比较理想的。

3.2.2信度评估

结果得出内部一致性即同质性信度α=0.765,李筱菊(1997:100)认为理想的α值要求达到0.8,故内部一致性不是特别理想。因此,某些题需要修改,题的干扰项设计的不太合理,也可能某些题干没给予受试者足够的信息,使其得出正确答案。3.3可操作性评估

此次测试从设计和使用两方面来看,可操作性较强。资源极易获得,如NMET词汇大纲,随机抽样表。设计题干时,可利用字典、词汇书、英语国家语料库(BritishNational Corpus,http://info.ox.ac.uk/bnc/what/index.html)中的例句,也可自己编写,然后请外籍人士审阅。50分钟的测试时间使老师可选择在任何一节课堂上完成。所以,无论从人力、物力、财力及时间各方面来看,都是可控的。3.4反拔作用的评估

通过考试的结果,老师可清楚得知13.3%的学生达到80分以上的要求。它提醒老师要进一步加强学生词汇的复习和掌握。每位学生也可通过成绩了解自己掌握了多少个大纲要求掌握的词汇,进而更加合理地安排自己的高考英语复习计划。从这个意思上讲,它的反拔作用是积极的。

本次测试另一个反拔作用就是对学生学习策略的积极影响。John Read(N.Schmitt,M.McCarthy ed.,2002:307)提出缺乏语境的测试题将诱使学生只学习单词表,而不愿采用其他的学习策略。Ahmed(N.Schmitt & M.McCarthy ed.,2002:202)通过研究发现好的英语学习者采用多种多样的学习策略,而弱的英语学习者学习策略单一。因此,培养学习者多种学习策略是学好英语的关键。Part1&2&5,学生从一组单词中分辨出一个与所给词语义关系相近,相反或与其他三个单词不同的单词,可以促使学生养成建立英语词汇间联系的学习习惯。据日本的一项研究(同上:221)表明最有用的巩固词义的策略是“双语词典”、“笔头重复”、“口头重复”、“大声朗读单词”、“学习单词拼写”、“记课堂笔记”,由此看出,学习单词拼写是有助于记忆词意。Part4、part8、part10鼓励学生重视单词拼写,尤其是在多项选择题盛行的情况下。Part6&8的突出优势是使学生及早地养成用英语解释词语的习惯,能够用英语解释词语就减少看英文时先转换成汉语的翻译过程,对学生英语阅读能力的发展非常有益(武,2002:74~75)。Part7&9&10通过上下文来测试单词,培养学生通过上下文猜测词义的能力。

(下转89页)

教学案例

造一定的朗读情境,激发学生的朗读兴趣,在的联系,组合的结果,可以使体验阅读教使学生更好地感悟课文的情感主旨。如学学过程完整而又符合教学规律,有利于调习课文《贝多芬传》就很有必要聆听一下动学生的积极性,使之主动参与,合作学《命运交响曲》,领悟“命运在敲门”的韵味;习,不断发展,获得语文智能和身心素质的学习课文《始终眷恋着自己的祖国》可以唱全面发展。一下国歌,体验爱国情怀等等,这些都有助于学生对课文思想内涵的把握和体会,使3体验式阅读教学的配套策略学生得到思想情感的熏陶和感染。3.1提出并力行一些基本原则

积累,体验生活。通过阅读体验,逐步积体验阅读不是任意的,而是基于严谨累词汇、积累知识、积累技巧方法,这是符的计划、符合规律的要求和必要的原则。其合语文学习的认知规律的。阅读中的积累中,需要遵循并力行的基本的教学原则应环节,也具体地承担了这个任务。如《孔乙该包括:开放原则、观点广泛原则、合作性己》一文中,孔乙己两次付钱,作者用两个原则、实践性原则等,力求体验阅读符合教不同的动词,一“排”一“摸”形成了鲜明的学规律和认知规律。例如观点广泛原则,就对比,学生通过阅读比较探究,体验排、摸应该允许学生的不同观点和意见,即使对的具体情形,可以体会和认识作品遣词用《周总理,你在哪里》无法引起共鸣,也不必句的精妙。苏版教材的多篇课文,都可以让勉强;觉得《海燕》重复罗嗦,也应该鼓励其学生在朗读中揣摩,怎样合理地变换语气大胆质疑的精神。的轻重、语速的缓急、停顿的长短等,以表3.2建立阅读常规现各种心理情状和思想情感。这样,在朗读建立阅读教学常规,规范学生阅读行体验中走进课文展现的艺术世界,感受故为。习惯作为一种动力定型,是在多次实践事情节,体验作品的思想内蕴,也为生活积或重复练习中形成的,其中离不开一定外累经验。部条件的制约和影响。建立阅读教学常规

实践,体验创新。体验式阅读教学,当然就是要制约学生的阅读行为,使正确的阅必须突出实践活动。具体的实践,可以是学读行为得到重复练习,得到强化,趋于稳生外出参观体验,也可以是模仿课文写作,定,也就是“习惯成自然”;同时又摈除那些还可以是阅读后的上网材料收集,即使是不合规范的不良阅读行为。由于良好习惯阅读过程中的对比质疑,也算是一种体验,是习得的,并非一朝一夕能够养成,因而更例如有学生在阅读《醉翁亭记》的时候,认重要的是要长期坚持这些阅读教学常规,为“负者歌于途,行者休于树”应该改为“负严格要求学生坚持不懈地实践。著名特级者休于树,行者歌于途”,这样更合乎情理。教师魏书生就很重视阅读教学常规的建这就是体验以后的一种创新,类似这种有立,如规定每个学期开学前学生通读新的价值的探究,教师应该特别予以肯定。语文课本,完成固定的作业;又如读一篇课

这四个环节既可以独立操作,又有内文要求学生按“四遍八步读书法”进行阅

读。他对每一届学生都制定了语文教学常

规,并始终如一地坚持执行,使学生形成了习惯。

3.3教师必须身体力行,主动体验

体验式阅读教学,实际上对教师提出了更高的要求,教师必须时刻关注学科发展前沿和方向,不断充实和更新教学内容,充分调动学生的主动性、积极性,启发学生探求未知世界的兴趣。教师身体力行,有了满桶水,才好提供给学生源源不绝的活水源泉。特别是在阅读方法上尝试,得出可行性的方案,再用以指导学生,效果就很好。如精读、略读、浏览、默读、朗读、勾画圈点读书法、生疑发问读书法等等,这些都需要教师先行尝试乃至于熟练,才能指导学生使用。

4结语

总之,实施体验式阅读教学,能使学生成为课堂的主角,学生在自主阅读、合作互动中逐步建立起基于教师指导下的探究式的学习模式,培养提出、解决问题的能力和合作精神,锻炼表达和思辨能力。通过体验式的阅读,学生不仅可以学到一般的科学知识和方法,更可得到严谨治学、探索精神的历练。

参考文献

[1]赵毅.语文探究性教学的策略[J].中学

语文教学参考,2003(10).

[2]王小萍,在欣赏中阅读,在阅读中欣赏

[J].语文学刊,2005(24).

(上接87页)

4结语

英语词汇知识是各项英语语言技能发

展的基础。词汇知识积累直接影响学生英语交际技能的发展。死记硬背相互毫无联系的单个词汇不是有效的学习方法。本文尝试设计一份较能产生积极反拔作用的词汇测试题,不仅可以帮助教师及同学们了解自己掌握大纲的词汇现状,也希望藉此帮助学习者培养多种学习策略。本文从四个方面评估了此份测试题,了解到本测试的内部一致性不是很理想,需要进一步对测试题做项目分析。

[3]

[4]

[5]

参考文献

[1] Bachman,L.F.,and A.S.Palmer.Lan-

guage Testing in Practice[M].OxfordUniversity Press,Shanghai:ShanghaiForeign Language Education Press,1996.[2]Heaton,J.B.Writing English Language

Tests(New edition)[M].Beijing:Foreign

[6][7][8]

Language Teaching and Research Press,

2000.

Henning,G.A Guide to LanguageTesting:Development,Evaluation andResearch[M].Foreign Language Teachingand Research Press,2001.

Hughes,A.Testing for LanguageTeachers[M].Cambridge UniversityPress.Beijing:Foreign Language Teach-ing and Research Press,2000.

Schmitt,N.McCarthy,M.(ed.).2002,Vocabulary:Description,Acquisition andPedagogy[M].Shanghai:Shanghai For-eign Language Education Press,2002.李绍山.语言研究中的统计学[M].西安:西安交通大学出版社,2001,2.

李筱菊.语言测试科学与艺术[M].长沙:湖南教育出版社,2001,2.

刘润清,韩宝成.语言测试和它的方法[M].北京:外语教学与研究出版社,1991.

[9]亓鲁霞.论考试后效[J].外语与外语教

学,2006,8:29~31.

[10]亓鲁霞.NMET的反拔作用[J].外语教学

与研究,2004,5:357~362.

[11]武尊民.英语测试的理论与实践[M].北

京:外语教学与研究出版社,2002.

[12]余心力,陈鸽,张乃鑫.高考英语单词排

名记忆宝典[M].北京:知识出版社,2005.

高中英语词汇测试的设计与评估

作者:作者单位:刊名:英文刊名:年,卷(期):

王莉晖, 刘志辉

王莉晖(广东省顺德职业技术学院外语系,广东佛山,528300), 刘志辉(湖南省湘南学院外语系,湖南郴州,423000)

中国科教创新导刊

CHINA EDUCATION INNOVATION HERALD2009(15)

参考文献(12条)

1.Bachman L F;A S Palmer Lan guage Testing in Practice 19962.Heaton J B Writing En glish Lan guage Tests 2000

3.Henning G A Guide to Lan guage Testing:Development,Eval u a tion and Research 20014.Hughes A Testing for Lan guage Teachers 2000

5.Schmitt N;McCarthy M 2002,Vocabulary:Description,Acquisition and Pedagogy 20026.李绍山 语言研究中的统计学 20017.李筱菊 语言测试科学与艺术 20018.刘润清;韩宝成 语言测试和它的方法 1991

9.亓鲁霞 论考试后效[期刊论文]-外语与外语教学 2006(08)10.亓鲁霞 NMET的反拔作用[期刊论文]-外语教学与研究 2004(05)11.武尊民 英语测试的理论与实践 2002

12.余心力;陈鸽;张乃鑫 高考英语单词排名记忆宝典 2005

本文读者也读过(9条)

1. 徐晓光 英语阅读理解应试理论探析[期刊论文]-山东师范大学外国语学院学报(基础英语教育)2003(3)

2. 张亚兰.周侠.刘彦峰.ZHANG Ya-lan.ZHOU Xia.LIU Yan-feng 英语语言测试设计原则简论[期刊论文]-甘肃联合大学学报(社会科学版)2007,23(6)

3. 付祥芝 英语教学测试设计[期刊论文]-信阳农业高等专科学校学报2002,12(3)4. 单满菊 试论三种常用英语测试题型及其优劣性[期刊论文]-平顶山师专学报2004,19(1)5. 刘肖沛.Liu Xiaopei 语言测试的类型与原则[期刊论文]-青岛远洋船员学院学报2001,22(1)6. 姚菲 英语练习的有效设计与科学讲评[期刊论文]-考试周刊2010(56)

7. 张丽华 中考英语听力典型题型设计与说明[期刊论文]-黑龙江教育(中学教学案例与研究)2009(5)8. 崔国艳 词汇习得方法实证研究的质量评估[期刊论文]-科教文汇2008(29)

9. 魏湘萍 测试考生综合能力的英语试题--完型填空[期刊论文]-龙岩师专学报2003,21(2)

引用本文格式:王莉晖.刘志辉 高中英语词汇测试的设计与评估[期刊论文]-中国科教创新导刊 2009(15)


相关文章

  • 学术能力评估测试新变局
  • 新学术能力评估测试满分从2400降回1600分,作文改成选择性测试,只剩下阅读和数学两个部分,每个部分均以800分为满分.写作部分中的语法内容可能移到阅读部分,以另外一种形式进行考查.此外,这次变革的一个重要变化是,选错答案不再倒扣分,学生 ...查看


  • 知识基础对大学生创新思维的影响
  • 作者:楼连娣庞维国 华东师范大学学报:教育科学版 2015年05期 创新是指产生新颖而又适宜的产物的能力(Sternberg & Lubart,1996),它与个体所拥有的知识密切相关.创新研究领域的多数学者认为,创新思维是新旧知识 ...查看


  • 大学英语]课程介绍
  • <大学英语>课程介绍 一.教学对象 中国传媒大学非外语专业本科生. 二.教学目标 大学英语的教学目标是培养学生的英语综合应用能力,特别是听说能力,使他们在今后工作和社会交往中能用英语有效地进行口头和书面的信息交流,同时增强其自主 ...查看


  • DIY留学:美国高中留学流程
  • 对于国内的学生而言,要想成功申请就读于美国的私立高中,就不得不去关注其常见的几种类型的考试,明确考试规则,从而做到有备无患: 1.托福或小托福 (1)托福: 托福"译自TOEFL,中国人称为考"托福".至今为止 ...查看


  • 语言测试的历史演变及发展趋势
  • 西北大学学报(哲学社会科学版) 2006年7月, 第36卷第4期, Jul . , 2006, Vol . 36, No . 4 Journal of North west University (Phil os ophy and Soci ...查看


  • 从文化的视角设计高职英语翻转课堂教学
  • [摘要]近年来,翻转课堂已成为国内外教育界关注的焦点.本文以A职业技术学院翻转课堂设计的前期分析为基础,从文化的视角出发,以<新起点大学基础英语教程1>中的某一课为例,从课前准备.课堂活动和效果评估三个方面设计翻转课堂教学,以证 ...查看


  • 大学英语课程教学大纲(总纲)
  • 大学英语课程教学大纲 (总纲) 公共外语部 2007年10月修订 太原师范学院公共外语部 大学英语课程教学大纲 [说明] 按照教育部的要求,鉴于全国高校的教学资源.学生入学水平以及所面临的社会需 求等都不尽相同,各校应参照教育部正式公布的& ...查看


  • 广西民族大学
  • 广 西 民 族 大 学 2014年招收攻读硕士学位研究生专业目录 2 广 西 民 族 大 学 3 4 5 5 6 7 8 9 10 11 考试科目内容范围 初试考试大纲(不排除超出该范围的可能) 617体育学专业基础综合:(总分300分) ...查看


  • 从一项调查看大学英语考试存在的问题_韩宝成
  • 2004年第2期总第179期外语与外语教学 ForeignLanguagesandTheirTeaching 2004,№2Serial№179 从一项调查看大学英语考试存在的问题 韩宝成 戴曼纯 杨莉芳 (北京外国语大学中国外语教育研究中 ...查看


热门内容