首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 421 毫秒
1.
目前,我国的中小学教学管理与评价遇到了一些新问题,这些问题包括不同学年度学生的成绩比较,不同地区、不同学校学生的成绩比较,不同班级教师的教学水平比较,等等。以上这些问题可以运用教育测量中的测验等值技术来解决。根据中小学教学管理与评价问题的不同,测验等值需要进行不同的设计。本文结合实际案例,介绍测验等值技术在中小学教学管理与评价实践中的运用。  相似文献   

2.
本研究采用锚测验非等组设计,探究了锚测验样本量的变化对等值结果的影响。数据来自全国英语等级考试(PETS),使用以Bigsteps为核心的自主改进软件,基于Rasch模型估计题目参数。为了探究等值结果对合格分数线的影响,本研究对比了不同样本量锚测验参数估计值与锚题参数给定值的差异,并对不同样本量锚测验得出的实考试卷等值结果与最大样本量锚测验得出的实考试卷等值结果进行了差异分析。结果表明,当锚测验样本量达到150时,等值结果比较稳定。这一结果表明,PETS设定的300人左右的锚测验样本量是合理的。  相似文献   

3.
由于测验安全性、试卷组卷不当等问题,有些测验的题本相互之间不能或者没有设置锚题。对作答不同题本的被试进行分数比较时,需要用到测验等值技术。不同于有锚题测验能通过题本之间的锚题进行等值,无锚题情境下的测验需要借助于一些特殊方法进行等值。目前,对无锚题测验进行等值主要有三种方式,一种是通过测验中具体的题目,也就是构建相同的"锚题"来进行等值,如构造随机等组测验法和利用题目先验信息进行等值的方法;一种是通过构建相同被试组来进行等值,即构造随机等组样本法;还有一种是借助于测验题目所考查的认知属性来进行等值,一般是基于一种认知诊断模型——规则空间模型来进行操作。  相似文献   

4.
曹文娟  白俊梅 《考试研究》2013,(3):79-85,33
本文使用R-2.15.2软件模拟研究锚测验难度参数方差特征对测验等值误差的影响,采用三种等值方法(链百分位等值法、Levine等值法和Tucker等值法)对锚测验不同类型的难度方差进行比较研究。结果显示,当锚测验难度方差小于全测验难度方差时,其等值的随机误差和系统误差与锚测验难度方差和全测验难度方差一致时(即锚测验为全测验的平行缩减版minitest时)的表现基本相同。因此,对锚测验而言,要求其与全测验具有相同的统计规格可能过于严格。  相似文献   

5.
为探讨全测验与锚测验不同的客观题与主观题分值比对等值误差造成的影响,本文设计两种全测验与锚测验题型分值比,以等值标准误为因变量,构建2X2的两因素完全随机化设计进行等值误差的方差分析。结果表明,全测验题型分值比与锚测验题型分值比两因素的主效应显著(P〈0.001),交互作用显著(P〈0.01),简单效应检验表明两因素在各水平上差异显著(P〈0.01)。全测验题型分值比与锚测验题型分值比对等值误差产生一定的影响,在等值过程中应该考虑这两个影响因素,为了减小等值过程的误差,锚测验题型分值比应该尽量与全测验题型分值比相一致。  相似文献   

6.
测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。  相似文献   

7.
在无锚情况下,国外学者提出可利用被试背景信息变量对非等组的被试进行最小鉴别信息加权构建伪等组实现分数连接。为探讨和分析伪等组等值在我国测验情境中应用的准确性,采用实证数据,对比分析了伪等组等值与传统锚题等值的结果。结果显示,在被试背景信息变量与待等值测验分数的相关达到0.75左右时,伪等组等值所产生的等值误差接近传统锚题等值,其等值分数与传统锚题等值分数的对比结果也显示,伪等组等值不存在等值重要差异,即二者的差异不会带来实际影响。结果表明,在一定测验情境下,伪等组等值可以成为传统等值的有效替代。未来研究可对伪等组等值在不同测验情境中应用的准确性进行更多验证。  相似文献   

8.
为降低学生学业负担,避免学生因偶然因素导致的考试误差,新一轮高考改革要求为考生提供两次外语及学业水平考试机会。在此背景下,如何比较两次考试成绩成为关键。测验等值技术作为心理测量学的重要组成部分,恰能有效解决测验分数比较的问题。通过对等值概念、等值设计、等值处理方法及等值评估等问题的探讨,分析了高考等值应注意的问题及其可能采取的等值方法,为实现高考成绩比较科学化提供技术支持。  相似文献   

9.
测验等值的单组设计,是将需等值的测验X、Y都由同一考生组施测,然后对测验分数进行等值。其优点是考生组只有一个X、Y成绩的差异将归因于测验的不同而不会混杂考生组不同的因素。缺点是同一考生要测验两次,练习效应和疲劳将会干扰等值结果。本文提出一种新的设计方法──单组设计试卷分半法,是在单组设计中,把测验X、Y各分成平行的两半卷,各取X、Y的半卷组成新的测验Z,将Z对同一考生组施测,根据施测结果导出等值转换公式进行分数等值转换。这种方法每个考生只施测一次,既保持了单组设计的优点,又克服了它的缺点。  相似文献   

10.
在测验考试中,人们显然有种种理由要求比较、解释不同地区、单位、时间的同一学科的考试分数;在考试命题中,也有理由希望对同一学科不同形式的试卷、试题参数作比较,从而确保测验考试的公平和正确评价试题建立题库等等.这些,都涉及到“等值 问题.所以,测验等值是考试研究中均一个非常重要的问题.一、测验等值的概念、作用、形式测验等值,是指对测量同一心理特质的不同测验分数或试题参数,通过一定的数学模型,转换成同一单位系统中的量数,以利于相互比较的方法.测验等值的转换,是独立于导出这种转换式时所使用的具体考生组的.好象天气预报时气温摄氏度数与华氏度数的互化有公式F=1.8c+32一样,不依赖于当初求得这一公式时是从气体还是从液体物质中取得的.这是测验等值的一个重要特点,也是一项根本的要求.并非任何测验都是可以等值的,首先,进行等值的测验必须是测量同一心理特质的测验.比如比较考生不同次测验的成绩,只能是对同一学科的成绩相互比较.所以.不能通过值转换,把语文分数转化为数学分数,把初等数学分数转化为高等数学分数.因为这些都  相似文献   

11.
国际大型测评项目在年度内题本等值时,主要采用同时估计的方法实现对题目参数的估计,并使用似真值实现对学生个体能力的报告,各个测评项目之间的等值设计与处理相对统一与一致。在年度间等值时,不同的项目,依据各自的设计特点,采用锚题或锚人的方法,使用同时估计,并通过线性转换将学生能力分数置于同一量尺上,实现年度间分数的比较。依据我国国情,建议采用锚题与锚人相结合的等值设计方式实现年度间测评结果的链接。  相似文献   

12.
本研究采用“共同题?锚测验”设计,使用R语言ltm程序包中的IRT两参数模型进行各年级小学生数学学力认知诊断测验和被试参数的估计,并使用equateIRT程序包进行跨年级小学生数学学力认知诊断测验各项参数的等值转换。结果表明,等值转换后各年级测验的题目难度和小学生数学学力均随年级增长而逐渐递增,不同学校、民族、性别学生的数学学力发展差异性特征均与理论假设相符。本研究验证了采用IRT垂直等值方法构建跨年级小学生数学学力发展水平垂直量表的可行性,为制定系统性补救教学方案和自适应题库建设提供了必要的实证证据。  相似文献   

13.
测查同一心理特质的两个或多个测验的分数单位系统经过转换,从而使这些测验上的分数能够对应起来,就叫做测验等值或测验分数等值。这就好比度量温度的摄氏温度计与华氏温度计上的度数,经过单位系统的转换,从而可以实现互化一样。测验等值在测验实施,编制与结果分析,题库的建立,不同单位、地区、时间上的学科成绩的比较等方面,都是极为必要的。比如我们的高考,一般都有备用卷。当普通采用的正  相似文献   

14.
等值是保证测验公平性的主要手段,主观性试题由于具有试题数量少、容易曝光、难度控制较难、评分受评分者因素影响大等特点,其等值问题一直是测量界一大难题。研究从实际问题和现实需求出发,使用了MHK口语的实测数据,采用非等组锚题的设计,将笔试客观题的听力理解部分作为锚题,尝试对4套口试试卷进行了IRT等值处理,并以随机等组的办法对其等值效果进行了检验。研究结果表明,把听力理解部分作为锚题进行口试试卷等值具有一定的可行性,因其中涉及许多问题,研究的结论还需进一步验证。  相似文献   

15.
作为教育质量评价的重要手段,大规模教育测评中常使用多题本设计。多题本设计通常采用有共同题的不完全矩阵取样设计,共同题又有共同锚和循环锚两种设置方式。共同锚多题本设计需要考虑共同题的比例、内容结构、统计特征、在题本中的放置位置等。循环锚多题本设计即平衡的不完全矩阵设计,往往采用题目组块的方式组合题本,需要考虑题组数量、题组内部结构、题组的排列等。多题本设计的测验数据处理涉及项目反应理论模型下的量尺分数估计、量表化方法、等值技术等。探讨这些问题能为教育测验的设计提供指导和建议。  相似文献   

16.
锚题指的是在同一批被试或能力分布相等的两批被试中具有等值关系的试题.我国香港地区的全港性系统评估(TSA)在题库建设中采用锚题加独立题目的方式设计不同分卷,结合学科课程不同的考核要求,全面考查考生能力.以小学英语学科为例,TSA遵循多步固定分支测验策略设计锚题,设置固定的锚题比值,科学确立锚题难度,注重锚题的示范性和代表性.为了进一步优化试题质量,我国内地学科考试可尝试借鉴TSA题库建设中的锚题设计方法,如在评估初始阶段确定锚题、科学设置锚题比例、引进专业测评队伍等.  相似文献   

17.
等值误差理论与我国高考等值的误差控制   总被引:2,自引:0,他引:2  
测验等值误差有随机误差和系统误差两种。随机误差的产生来自于抽样,其大小主要受样本容量影响,有两种估计等值随机误差的方法。系统误差产生的原因比较复杂,有些系统误差可采用一定的办法予以估计,有些系统误差是无法估计的。我国高考等值的前期工作已经在方案设计、数据采集、锚题编制、等值关系计算等方面努力贯彻了误差控制思想,取得了较好效果。建议今后应采用预估样本容量,有计划更换锚题、精心设计等值路径、选择适当的平滑曲线次数等技术措施更有效地控制高考等值误差  相似文献   

18.
本研究通过随机选取2382名考生,采用共同组等值设计和线性等值法,对MHK三级与HSK三级、四级、五级、六级的考生成绩进行了等值,等值结果包括听力、阅读、书面表达各分测验分数及测验总分。  相似文献   

19.
韩阔 《中国考试》2004,(12):45-48
在考试中最为人们关注的应该是公平.怎样使考试公平也成为社会评价考试水平高低的重要标准。考试中的等值问题,的确是保证使考试公平的基础。《高等教育自学考试的等值研究》一文中通过对烟台师范学院大学二年级的300名学生的实验,经过锚测验和随机区组相结合的试验设计.对高教自考的等值问题进行了应用研究。经过严密的统计分析得出了2002年上半年全国高等教育自学考试英语(二)考试成绩向2001年下半年全国高等教育自学考试英语(二)考试成绩等值转换的分数对照表,并对其成绩的差异及本次试验研究的不足进行了分析。此文在考试技术层面的研究,严谨细致,观点方法可以探讨,一丝不苟的治学态度值得尊重。  相似文献   

20.
测验等值研究综述   总被引:1,自引:0,他引:1  
本研究从研究历史、概念界定、数据收集设计、等值模型和等值方法、等值误差及不同等值方法的评价标准等五个方面对测验等值研究进行了文献综述,以期为今后等值研究的进一步开展提供理论基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号