在线读书
心理学书籍

教师自编测验

  与教学目标相一致,教学评价也应包括认知、情感和技能三个方面。对于认知和技能领域的学业成就,最常用的教学评价手段是标准化成就测验和教师自编测验。对于情感以及道德行为表现则常常采用非测验性的评价手段,如案卷分析、观察、问卷量表以及谈 话等。当然,这些非测验性的评价手段也可作为学业成就评价的补充。

  (一)教师自编测验的含义与特点

  教师自编测验是由教师根据具体的教学目标、教材内容和测验目的,自己编制的测 验,是为特定的教学服务的。教师为检査学生某阶段学习情况而编制的单元测试就是教

  师自编测验。教师自编测验通常用于测量学生的学习状况,而标准化成就测验则用来判 断学生与常模相比时所处的水平。

  (二)教师自编测验设计前的计划

  (1)确定测验的目的。测验有不同的目的,有时是为了形成性评价,有时是为了总结 性评价,还有时是为了诊断学习困难儿童。目标不同,决定了测验的长度和题目的取样, 也影响测验题型的构成等。

  (2)确定测验要考査的学习结果。教师必须依据特定的教学目标来准备测验,测验 的重点要与教学目标基本保持一致。

  (3)列出测验要包括的课程内容。

  (4)写下测验计划或细目表。细目表是将考试具体化的最重要的工具,使得测验能 够与教学的目标和内容保持一致。细目表的形式是二维表,一栏表示学习结果,一栏表示 课程的内容或范围。中间的栏目,就是教师根据自己的情况填上在测验中计划测量多大 比例的学习结果和课程内容,详见表14-1。

  (5)针对计划测量的学习结果,选择适合的题型。自编测验包括客观题和主观题两 种类型。教师使用哪一种类型的题目是由测验的目的、内容和时间决定的。一般来说,这 两种题型各有优点和不足。通常客观题试题多且取样广泛和系统,评分较为客观,能涵盖 很多教学内容;但是客观题主要测量细节知识,较难反映对知识的组织与运用以及创新想 法。主观题可以测量文字表达能力、综合运用知识能力和分析评价能力,但是主观题客观 性差,评分主观,测题少且取样代表性差,评分困难且费时间。因此,教师自编测验最好对 这两种题型加以综合使用。

  (三)教师自编测验的题型

  1.客观题

  客观题的特点:问题给出较为明确,答案唯一,可较为客观地评分,而不同评分者的评 定结果相同。该类测题包括选择题、是非题、匹配题和填空题等(表14 - 2)。

  (1)选择题。选择题是由题干和两个或更多的选项组成的。题干可以是直接提问或 者以不完整的句子的形式出现,目的是为了设置问题情境,题干应该明确简单。选项则提 供可供选择的答案,包括一个正确答案和若干具有干扰性的错误项或迷惑项。选项的数 量一般没有统一的规定,教师可以随意确定选项的个数,大多是4?5个,这样可以避免学 生猜测答案。学生的任务就是阅读题目,再从一系列选项中挑选出正确的项目。

  选择题还有一种常用变式——多选题,选项中有一至多个正确答案。这种题型的难 度大大高于常规的选择题(单选题),可以有效地检査高一级的学习成果,在测验中使用 较广。

  (2)是非题。是非题与选择题有一点相似之处,学生需要识别、选择出正确答案。常 用的形式是,陈述一句话要求学生判断对错或是非。是非题可用于测量不同水平的教学 目标。

  是非题形式简单,能够在一份试卷内覆盖大量的内容。教师在评判时也较客观,计分 简便省时。但是,学生只有两种选择——对或错,即使在完全猜测的情况下,他们也有 50%的机会选择到正确答案。解决这种弊端有两种可行的办法:一是增加题目的数量,由 于题量大,对题目总体的取样较全面,学生很难只凭猜测获得高分;二是采用需要说明理 由的是非题来增加对学生考核的效用。

  (3)匹配题。匹配题是另一种可提供多种选择的考试形式。通常,题目包括两列词 句:一列是问题选项,一列是反应选项。学生根据题意按照某种关系将左右的项目连接起 来。匹配题形式简单,能够有效地测量学生对知识联系的掌握情况,且易于计分。但是, 它只能用于测查彼此存在着简单关系的知识。

  (4)填空题。填空题是呈现给学生一句或一段不完整的话或者直接提问,要求学生 简要回答。当教师的目的是考査学生对知识的回忆时,填空题十分有用,它可将学生猜测 的可能性降到最小。如果经过精心设计,也可以通过填空题来考査学生对知识记忆和理 解以及推理和判断能力。填空题的问题在于,学生的答案各不相同甚至会出现出人意料 的答案,学生的答案还会受笔迹、用词等无关因素的影响。

  2.主观题

  主观题要求学生自己组织材料,并采用合适的方式表达陈述出来。这类题型包括论 文题及问题解决题(表14-3)。教师在评分时,对学生的回答需要给出不同量的分值,而 不仅仅是满分或零分。

  (1)论文题。论文题是指要求学生用文字论述方式阐述相关观点的题目,回答字数 可以从几段到几大页不等。论文题一般常使用两种类型:有限制的问答题和开放式论文。 有限制的问答题,是指教师对回答的内容和长度都有规定,如平时测验中的简答题等。开 放式论文则允许学生在内容上可以自由选材,自由发挥,而且篇幅较长。

  论文题可以测验知识、理解或运用水平,也可考查学生的分析、综合、类比和评估知识 的能力,还可考查学生组织和表达信息的能力。

  使用论文题也有缺陷。首先,学生回答论文题花费时间很多。因此,在一份试卷里只 能出现少量的题目,对课程内容的取样也就非常有限。通过增加小的论文题(简答题或问 答题),可以避免这个问题。其次,在判卷时很难做到客观,导致信度较低。在评分时,经 常出现一种现象——晕轮效应,即教师对学生的总体印象影响到对论文题目的评价。对 于自己熟悉的学生,因为平时的接触或者前面几道题解答的情况,使得教师对学生形成了 某种印象,从而影响到对之后题目的评判。

  (2)问题解决题。问题解决题是向学生提供一定的问题情境和目标情境,要求学生 通过对知识进行组织、选择和运用等复杂的程序来解决问题。通常有两种形式:一种是间 接测验,另一种是直接测验。间接测验是采用纸笔测验来评价学生的学业成就或能力;学 生在完成时,通常必须写出若干步骤或过程,以展现他的思路;评分时,按照步骤计分,如 果缺少某些步骤就不能得分;平时的理科考试多出这种类型的问题解决题。直接测验考 査学生处理实际问题的能力,所以有时又称之为操作评价。例如,为了考査学生学习本节 内容的情况,让学生编制一份测验小学两步应用题的测题;要求学生设想一个可以解决本 市环境污染问题的方案(要求只写可行性措施,不超过500字);要求学生测量学校操场的 面积。操作评价对于考查高级思维技能十分有效,但是往往费时费钱,而且主观性较大, 并且效度也经常受到质疑。

  (四)有效教师自编测验的特征

  1.信度

  信度是指测验的可靠性,即多次测验分数的稳定、一致的程度。它既包括在时间上的 一致性,也包括内容和不同评分者之间的一致性。不同种类的信度是用信度系数来表示 的。信度有重测信度、评分者信度、复本信度和分半信度等。例如,采用性格量表测量学 生,他们在这一个月的结果,如果大致等于六个月前和三个月前的得分,那么我们就认为 测验在时间上的重测信度较高。又如,两位评分者教师对同一试卷的评分比较接近,那么 评分者信度就高。复本信度是指使用两个等值但题目不同的测验来测量同一组受测人, 然后计算出两次测验分数的相关系数。分半信度是将测验题目对分成两半,根据受测人 在这两半测验的分数所计算出来的相关系数。

  2.效度

  效度是指测量的正确性,即一个测验能够测量出其所要测量的东西的程度。效度考 虑的问题是:测验测量什么?测验对测量目标的测量精确性和真实性有多大?效度的重 要性大于信度,因为一个低效度的测验,即使具有很好的信度,也不能获得有用的资料。 例如,用磅秤称量体重,连续多次都会得到相同的值,而且准确地反映了个体的重量,那么 信度和效度都很高;但是如果使用它来测量身高,虽然测量值之间总是保持一致的,即信 度很好,但是并没有说明个体的高度,因而不是适宜的测量身高的工具。

  3.区分度

  区分度是指测验项目对所测量属性或品质的区分程度或鉴别能力。如果一个项目的 区分度高,那么水平高的或能力强的被试得分就会高,水平低的或能力弱的被试就会得分 低,这样就能把不同水平的被试区分出来。区分度低的项目不能对水平或能力有差异的 被试作很好的区分。区分度的指标通常是根据学生对测验项目的反应与某种参照标准之 间的关系来估计的。例如,学业成就测验可用年级或教师评定的等级作标准,看测验的项 目能否把不同年级或不同水平的学生区分开来。

  (五)教师自编测验的常见错误

  1.教师过于相信自己的主观判断而忽视测验的信度和效度指标

  教师在做评定时,有时不是根据学生在测验中表现出来的状况进行评价,而是依赖于 非正式观察所得到的资料。例如,对客观题评定时,如果学生给老师留下的印象较好,往 往得分也就较高。当学生的测验状况与非正式观察所得到的资料不吻合时,教师不能简 单断定,需要利用现有的信息,对学生进行更深入的分析和调查。

  2.许多教师对测验准备的重要性缺乏足够的认识,对测验准备不够充分,甚至没 有准备

  有些教师在出题时没有明确的测验目的和计划.不知道该搜集什么类型的信息;有些 教师编写试题受近因效应的影响,往往编制的内容大多是新近所讲内容,忽视以前学习的 内容。所以要求教师自编测验前使用细目表,这样可以避免上述问题。

  3.许多教师编制的测验太简单,题量太小

  编制的测验太简单,将不能有效区分出不同学生对知识点的掌握情况和能力水平。 题量小,难以保证试题取样全面,会直接导致测验的信度和效度降低。

  总之,相信主观判断、测验准备不充分、试题简单、题量小,都会导致过分强调无关细 节,不能准确反映学生的学习水平,从而降低考试的作用。

上一章 返回目录 下一章

· 推荐:全球通史 人类简史 时间简史 未来简史

点击收藏 小提示:按键盘CTRL+D也能收藏哦!

在线看小说 趣知识 人生格言