考试的测量学基础知识(十一):等值

等值(Equating)是一种在两个或多个测验版本的分数之间建立相互关系的过程,即将测量同一特质的不同测验版本的分数置于同一尺度上,使得参加不同测验版本的考生的分数可以直接相比,从而实现跨测验版本考生评价的公平性。其过程既包括分数的等值,也包括题目参数的等值。测验等值在不同版本测验的分数间建立起了直接链接,其目的是使测验的分数可互换使用,就好像它们来自同一个测验那样。

等值是标准化测验中非常必要的一个部分。考试项目不断产生新的测验试卷版本,使用这些不同的版本则要求分数量表的意义能够保持稳定。尽管这些版本构想相同,也往往基于相同的测验规范或测验蓝图,但是版本的差异总会多少带来一些统计特性上的差异。例如,一个测验比另一个测验难,如果不做调整,参加较难测验的考生得分就会较低。为公平起见,有必要运用等值消除测验版本间不想要的难度差异对分数所带来的影响,使得考生无论参加哪个版本的测验,等值后分数的意义都一样。

严格来讲,在两个不同版本的测验之间等值必须具备一定条件:

(1)同质性,即两个测验测量相同的构想(潜在特质、技能或者能力);

(2)等信度,即两个测验具有相同的信度;

(3)对称性,即把Y测验的分数等值到X测验的等值函数应该是把X测验的分数等值到Y测验的等值函数的反函数;

(4)公平性,即对于考生而言参加哪个版本的测验应该没有区别;

(5)跨样本不变性,即不管对于来自总体的哪个样本,用来链接X分数和Y分数的等值函数一样。

当某个考试项目推出新的版本,要确保新版本上的分数量尺与旧版本上的分数具有相同意义时,等值也是最重要的工作。例如,纸笔考试与计算机化考试,它们具有相同的测量构念、相同的考试大纲和相同的组卷蓝图,只是由于测验形式的变化可能会导致试题的统计特征有所变化。为了确保对所有考生公平,无论考生接受哪种形式的测试,都应该获得具有相同意义的分数。事实上,通过等值证明新版本考试分数与原有版本考试分数可替换使用,也可看作是新版本考试的一种效度证据。

供稿:关丹丹

等值(Equating)是一种在两个或多个测验版本的分数之间建立相互关系的过程,即将测量同一特质的不同测验版本的分数置于同一尺度上,使得参加不同测验版本的考生的分数可以直接相比,从而实现跨测验版本考生评价的公平性。其过程既包括分数的等值,也包括题目参数的等值。测验等值在不同版本测验的分数间建立起了直接链接,其目的是使测验的分数可互换使用,就好像它们来自同一个测验那样。

等值是标准化测验中非常必要的一个部分。考试项目不断产生新的测验试卷版本,使用这些不同的版本则要求分数量表的意义能够保持稳定。尽管这些版本构想相同,也往往基于相同的测验规范或测验蓝图,但是版本的差异总会多少带来一些统计特性上的差异。例如,一个测验比另一个测验难,如果不做调整,参加较难测验的考生得分就会较低。为公平起见,有必要运用等值消除测验版本间不想要的难度差异对分数所带来的影响,使得考生无论参加哪个版本的测验,等值后分数的意义都一样。

严格来讲,在两个不同版本的测验之间等值必须具备一定条件:

(1)同质性,即两个测验测量相同的构想(潜在特质、技能或者能力);

(2)等信度,即两个测验具有相同的信度;

(3)对称性,即把Y测验的分数等值到X测验的等值函数应该是把X测验的分数等值到Y测验的等值函数的反函数;

(4)公平性,即对于考生而言参加哪个版本的测验应该没有区别;

(5)跨样本不变性,即不管对于来自总体的哪个样本,用来链接X分数和Y分数的等值函数一样。

当某个考试项目推出新的版本,要确保新版本上的分数量尺与旧版本上的分数具有相同意义时,等值也是最重要的工作。例如,纸笔考试与计算机化考试,它们具有相同的测量构念、相同的考试大纲和相同的组卷蓝图,只是由于测验形式的变化可能会导致试题的统计特征有所变化。为了确保对所有考生公平,无论考生接受哪种形式的测试,都应该获得具有相同意义的分数。事实上,通过等值证明新版本考试分数与原有版本考试分数可替换使用,也可看作是新版本考试的一种效度证据。

供稿:关丹丹


相关文章

  • 4 测验分数等值及其常模量表的建立
  • 第4章 测验分数等值及其常模量表的建立 4.1 测验分数等值及其常模 4.1.1 测验等值的含义 测验等值是指对测量同一心理特质的不同测验的分数或试题参数,通过一定的数学方法,转换成同一单位系统中的量数,以利于相互比较的方法.测验等值包括分 ...查看


  • 心理测量学复习重点
  • 心理测量与测验 期末复习整理 第一章 心理测量的历史 1. 中国古代心理测量方法:观察法.访谈法.自然实验法 2. 冯特1879年在莱比锡大学建立第一所心理实验室. 最先倡导测验运动的是优生学创始人高尔顿.他开创了个别差异心理学研究,并采用 ...查看


  • [继电保护]考试复习题
  • <电力系统继电保护>考试复习题 一.问答题 1.什么是保护安装处的负荷阻抗.短路阻抗.系统等值阻抗? 2.纵联保护依据的最基本原理是什么? 3.电力系统如果没有配备完善的继电保护系统,想象一下会出现什么情景? 4. 解释&quo ...查看


  • 给排水注册设备工程师考试
  • 基础课 1 高等数学 1.1空间解析几何 向量代数 直线 平面 柱面 旋转曲面 二次曲面 空间曲线 1.2 微分学 极限 连续 导数 微分 偏导数 全微分 导数与微分的应用 1.3 积分学 不定积分 定积分 广义积分 二重积分 三重积分 平 ...查看


  • 试论高等教育自学考试题库建设
  • 试论高等教育自学考试题库建设 郭光明 摘 要 题库建设是对传统命题方式的变革,它以技术先进性.质量可控性和安全保密性等诸多优势代表了自学考试命题方式的未来发展方向.本文对自学考试题库建设的意义.指导思想.原则.目标以及组织实施等问题进行了初 ...查看


  • 戴海琦版心理测量学重难点考点归纳整理1
  • 心理测量学重难点考点归纳整理 一.心理测量的基本理论 (一)心理测量的基本理论 1)心理测量的基本概念 (1)心理测量的特点 ①间接性--心理属性是内在的不可直接测量到的特质,但可表现为一系列具有内在联系的外显行为,测量者可以通过一定的方法 ...查看


  • 注册给排水基础考试大纲
  • A,报考条件 (一)基础考试: 具备以下条件之一者,可申请参加基础考试: 1. 取得本专业(指公用设备专业工程中的暖通空调.动力.给水排水专业)或相近专业大学本科及以上学历或学位. 2. 取得本专业或相近专业大学专科学历,累计从事公用设备专 ...查看


  • 一级注册结构工程师基础考试大纲
  • 一级注册结构工程师基础考试大纲 科目 1.高等数学2.普通物理3.普通化学4.建筑材料5.理论力学6.材料力学7.结构力学8.流体力学9.土力学与地基基础10.工程测量11.结构设计12.建筑施工与管理113.结构试验14.电工学15.工程 ...查看


  • 什么是汉语水平考试
  • 中国汉语水平考试 汉语水平考试和中国汉语水平考试是同义词,已合并. 中国汉语水平考试(HSK )是为测试母语非汉语者(包括外国人.华侨和中国少数民族考生)的汉语水平而设立的国家级标准化考试.HSK 由北京语言大学汉语水平考试中心设计研制,包 ...查看


热门内容