共查询到20条相似文献,搜索用时 421 毫秒
1.
目前,我国的中小学教学管理与评价遇到了一些新问题,这些问题包括不同学年度学生的成绩比较,不同地区、不同学校学生的成绩比较,不同班级教师的教学水平比较,等等。以上这些问题可以运用教育测量中的测验等值技术来解决。根据中小学教学管理与评价问题的不同,测验等值需要进行不同的设计。本文结合实际案例,介绍测验等值技术在中小学教学管理与评价实践中的运用。 相似文献
2.
3.
4.
本文使用R-2.15.2软件模拟研究锚测验难度参数方差特征对测验等值误差的影响,采用三种等值方法(链百分位等值法、Levine等值法和Tucker等值法)对锚测验不同类型的难度方差进行比较研究。结果显示,当锚测验难度方差小于全测验难度方差时,其等值的随机误差和系统误差与锚测验难度方差和全测验难度方差一致时(即锚测验为全测验的平行缩减版minitest时)的表现基本相同。因此,对锚测验而言,要求其与全测验具有相同的统计规格可能过于严格。 相似文献
5.
为探讨全测验与锚测验不同的客观题与主观题分值比对等值误差造成的影响,本文设计两种全测验与锚测验题型分值比,以等值标准误为因变量,构建2X2的两因素完全随机化设计进行等值误差的方差分析。结果表明,全测验题型分值比与锚测验题型分值比两因素的主效应显著(P〈0.001),交互作用显著(P〈0.01),简单效应检验表明两因素在各水平上差异显著(P〈0.01)。全测验题型分值比与锚测验题型分值比对等值误差产生一定的影响,在等值过程中应该考虑这两个影响因素,为了减小等值过程的误差,锚测验题型分值比应该尽量与全测验题型分值比相一致。 相似文献
6.
测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。 相似文献
7.
在无锚情况下,国外学者提出可利用被试背景信息变量对非等组的被试进行最小鉴别信息加权构建伪等组实现分数连接。为探讨和分析伪等组等值在我国测验情境中应用的准确性,采用实证数据,对比分析了伪等组等值与传统锚题等值的结果。结果显示,在被试背景信息变量与待等值测验分数的相关达到0.75左右时,伪等组等值所产生的等值误差接近传统锚题等值,其等值分数与传统锚题等值分数的对比结果也显示,伪等组等值不存在等值重要差异,即二者的差异不会带来实际影响。结果表明,在一定测验情境下,伪等组等值可以成为传统等值的有效替代。未来研究可对伪等组等值在不同测验情境中应用的准确性进行更多验证。 相似文献
8.
9.
莆田高专测验等值研究课题组 《莆田学院学报》1999,(1)
测验等值的单组设计,是将需等值的测验X、Y都由同一考生组施测,然后对测验分数进行等值。其优点是考生组只有一个X、Y成绩的差异将归因于测验的不同而不会混杂考生组不同的因素。缺点是同一考生要测验两次,练习效应和疲劳将会干扰等值结果。本文提出一种新的设计方法──单组设计试卷分半法,是在单组设计中,把测验X、Y各分成平行的两半卷,各取X、Y的半卷组成新的测验Z,将Z对同一考生组施测,根据施测结果导出等值转换公式进行分数等值转换。这种方法每个考生只施测一次,既保持了单组设计的优点,又克服了它的缺点。 相似文献
10.
在测验考试中,人们显然有种种理由要求比较、解释不同地区、单位、时间的同一学科的考试分数;在考试命题中,也有理由希望对同一学科不同形式的试卷、试题参数作比较,从而确保测验考试的公平和正确评价试题建立题库等等.这些,都涉及到“等值 问题.所以,测验等值是考试研究中均一个非常重要的问题.一、测验等值的概念、作用、形式测验等值,是指对测量同一心理特质的不同测验分数或试题参数,通过一定的数学模型,转换成同一单位系统中的量数,以利于相互比较的方法.测验等值的转换,是独立于导出这种转换式时所使用的具体考生组的.好象天气预报时气温摄氏度数与华氏度数的互化有公式F=1.8c+32一样,不依赖于当初求得这一公式时是从气体还是从液体物质中取得的.这是测验等值的一个重要特点,也是一项根本的要求.并非任何测验都是可以等值的,首先,进行等值的测验必须是测量同一心理特质的测验.比如比较考生不同次测验的成绩,只能是对同一学科的成绩相互比较.所以.不能通过值转换,把语文分数转化为数学分数,把初等数学分数转化为高等数学分数.因为这些都 相似文献
11.
12.
本研究采用“共同题?锚测验”设计,使用R语言ltm程序包中的IRT两参数模型进行各年级小学生数学学力认知诊断测验和被试参数的估计,并使用equateIRT程序包进行跨年级小学生数学学力认知诊断测验各项参数的等值转换。结果表明,等值转换后各年级测验的题目难度和小学生数学学力均随年级增长而逐渐递增,不同学校、民族、性别学生的数学学力发展差异性特征均与理论假设相符。本研究验证了采用IRT垂直等值方法构建跨年级小学生数学学力发展水平垂直量表的可行性,为制定系统性补救教学方案和自适应题库建设提供了必要的实证证据。 相似文献
13.
14.
15.
16.
陈丽曼 《教育测量与评价(理论版)》2021,(9):48-55
锚题指的是在同一批被试或能力分布相等的两批被试中具有等值关系的试题.我国香港地区的全港性系统评估(TSA)在题库建设中采用锚题加独立题目的方式设计不同分卷,结合学科课程不同的考核要求,全面考查考生能力.以小学英语学科为例,TSA遵循多步固定分支测验策略设计锚题,设置固定的锚题比值,科学确立锚题难度,注重锚题的示范性和代表性.为了进一步优化试题质量,我国内地学科考试可尝试借鉴TSA题库建设中的锚题设计方法,如在评估初始阶段确定锚题、科学设置锚题比例、引进专业测评队伍等. 相似文献
17.
等值误差理论与我国高考等值的误差控制 总被引:2,自引:0,他引:2
戴海崎 《江西师范大学学报(哲学社会科学版)》1999,(1)
测验等值误差有随机误差和系统误差两种。随机误差的产生来自于抽样,其大小主要受样本容量影响,有两种估计等值随机误差的方法。系统误差产生的原因比较复杂,有些系统误差可采用一定的办法予以估计,有些系统误差是无法估计的。我国高考等值的前期工作已经在方案设计、数据采集、锚题编制、等值关系计算等方面努力贯彻了误差控制思想,取得了较好效果。建议今后应采用预估样本容量,有计划更换锚题、精心设计等值路径、选择适当的平滑曲线次数等技术措施更有效地控制高考等值误差 相似文献
18.
19.
在考试中最为人们关注的应该是公平.怎样使考试公平也成为社会评价考试水平高低的重要标准。考试中的等值问题,的确是保证使考试公平的基础。《高等教育自学考试的等值研究》一文中通过对烟台师范学院大学二年级的300名学生的实验,经过锚测验和随机区组相结合的试验设计.对高教自考的等值问题进行了应用研究。经过严密的统计分析得出了2002年上半年全国高等教育自学考试英语(二)考试成绩向2001年下半年全国高等教育自学考试英语(二)考试成绩等值转换的分数对照表,并对其成绩的差异及本次试验研究的不足进行了分析。此文在考试技术层面的研究,严谨细致,观点方法可以探讨,一丝不苟的治学态度值得尊重。 相似文献