共查询到20条相似文献,搜索用时 125 毫秒
1.
相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度。实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景。 相似文献
2.
1前言 测验等值是对考核同一心理品质的多个测验形式系统地做出测验分数转换.从而使不同测验形式的测验分数之间具有可比性。由于项目反应理论(IRT)将项目难度与心理特质(能力)定义在同一量表上,故也可以认为IRT中的等值是将考核同一心理品质的多个测验形式系统地做出项目参数转换.从而使不同测验形式中的项目参数之间具有可比性。 相似文献
3.
如何确立标准参照测验中的合格分数是涉及到测验公平性的一个技术问题,介绍与之相关的经典测验理论(CTT)下的被试组对比判断法、测验内容分析判断法,项目反应理论(IRT)指导下的确立方法等,以期对广大考试工作者有所借鉴与启示。 相似文献
4.
本研究采用“共同题?锚测验”设计,使用R语言ltm程序包中的IRT两参数模型进行各年级小学生数学学力认知诊断测验和被试参数的估计,并使用equateIRT程序包进行跨年级小学生数学学力认知诊断测验各项参数的等值转换。结果表明,等值转换后各年级测验的题目难度和小学生数学学力均随年级增长而逐渐递增,不同学校、民族、性别学生的数学学力发展差异性特征均与理论假设相符。本研究验证了采用IRT垂直等值方法构建跨年级小学生数学学力发展水平垂直量表的可行性,为制定系统性补救教学方案和自适应题库建设提供了必要的实证证据。 相似文献
5.
李映红 《教育测量与评价(理论版)》2009,(4):8-10
目的:比较CTT和IRT项目参数的相关性及各自的特点。方法:选取200个项目、480名被试,分别求出CTT的难度和区分度,用ANOTE软件求出IRT的三参数逻辑斯蒂克模型中的a、b、c参数以及能力值为-0.475的信息量,对CTT和IRT的参数值分别进行spearman相关分析。结论:CTT中的难度和区分度分别与IRT中的b参数和a参数有较高的一致性,CTT中的难度与IRT中的C参数有显著的负相关;IRT中的信息量受参数a、b、c三者的影响。 相似文献
6.
7.
8.
铆测验设计下确定IRT等值常数的新方法 总被引:3,自引:0,他引:3
本文研究铆测验设计下确定IRT等值常数的新方法,提出估计等值常数的新公式,该估计公式具有鲜明的统计意义,充分利用从项目数据得出的难度、区分度估计值,同时具有计算简便的优点。 相似文献
9.
一、导言测验的单维性假设是 IRT 使用的前提条件之一。单维性假设如果得不到满足,IRT 的优点便不复存在。甚至可能导致错误结论。因此,单维性问题一直受到测量学家们的关注。什么是测验的单维性假设呢?简单地说,测验的单维性是指一个测验只测查了一种或主要是一种潜在的心理特质或能力,其他任何因素都不会影响被试在该题目上的作答反应的特性。即该测验的完全潜在特质空间是一维的。这里,完全潜在特质空间指的是这样一种空间,“它包含影响被试题目反应水平的所有‘重要的’心理特质,但不包括那些反应‘测量误差’的变量。” 相似文献
10.
以项目反应理论IRT(ItemResponseTheory)为基础,介绍项目反应理论IRT的特点,以及基于项目反应理论IRT的计算机自适应测试的工作原理,并在此基础上总结了起点选择的方法,提出了测试流程两步制的改进方案,通过对测试流程的改进,大大减少了与被试能力值相差较远的测试项目,缩短了测试时间和计算量,同时能准确地估计被试能力值。 相似文献
11.
12.
13.
李映红 《湖南第一师范学报》2007,7(3):31-33
好的评价方法能给学生学业成就科学公正的评价,可以正确引导学生找出不足,激励学习。根据小学学业成就评价方法的现状,对照传统的CTT理论和现代测量理论IRT的优缺点,提出项目反应理论(IRT)指导下的计算机自适应测验(CAT)作为传统测验的一种辅助方式,应用于小学学业成就评价中是必要的,也是可行的。 相似文献
14.
面试前有关被试的心理测验信息对考官面试评价的影响研究 总被引:1,自引:0,他引:1
面试作为一种常用的人事选拔技术正受到研究者的日益关注。本研究考察了面试前有关被试的测验信息对考官面试评价的影响,结果表明,这种影响是存在的,特别是消极的测验信息对面试评价的影响更大,同时测验信息对面试新手评价的影响比对有经验的人事工作者来说更大。不同种类的测验信息对面试评价的影响不同,能力测验的信息对面试评价的影响比个性测验大,同时能力测验信息并不是只对与其相关的能力维度的面试评价有影响,而是对各个维度的面试评价产生广泛的影响。 相似文献
15.
面试作为一种常用的人事选拔技术正受到研究者的日益关注,本研究考察了面试前有关被试的测验信息对考官面试评价的影响,结果表明,这种影响是存在的,特别是消极的测验信息对面试评价的影响更大,同时测验信息对面试新手评价的影响比对有经验的人事工作者来说更大。不同种类的测验信息对面试评价的影响不同,能力测验的信息对面试评价的影响比个性测验大,同时能力测验信息并不是只对与其相关的能力维度的面试评价有影响,而是对各个维度的面试评价产生广泛的影响。 相似文献
16.
项目反应理论下的测验信度能够评价潜在特质估计的可靠性与稳定性,由于具有宏观性的特点,项目反应理论信度的作用并不能被测验信息函数所取代,是IRT测验的一个重要指标。本文参考国内外文献,首先介绍国内外学者关于IRT信度作用的观点,并介绍和评价了多种IRT信度估计方法,然后简要介绍IRT信度的影响因素,最后展望了IRT信度领域后续研究尚可着力之处。 相似文献
17.
刘发明 《赣南师范学院学报》2005,26(6):64-66
介绍了项目反应理论(IRT)的基本理论和计算机化自适应测试(CAT)的实现过程。并在Visual Stu-dio.net2003的环境下,以SQL作为后台数据库,以三参数Logistic模型为项目反应模型,开发了一个基于WEB的CAT系统。 相似文献
18.
目前,越来越多的考试都应用项目反应理论(Item Response Theory,称简IRT)作为题目分析、题库建设以及分数估计等方面的主要方法。但是,这一方法因为具有太多的数理统计内涵,以至不容易被人掌握。而且,目前用于IRT参数估计的软件虽然不少,比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等(Embretson & Reise,2000),但是作为商业软件,这些工具都有特定的应用范围和条件,并且功能过于复杂,设计的目的主要 相似文献
19.
目的:运用IRT等级展开模型编制中学生学习焦虑综合量表,为中学生学习焦虑的评估、咨询与辅导提供工具,并探讨中学生学习焦虑理论结构。方法:采用理论与实践相结合的方法构建中学生学习焦虑结构,并在文献、访谈和问卷调查的基础上,构建中学生学习焦虑项目库,经两次测试与项目筛查,确定正式量表。取样在湖南省长沙、邵阳、岳阳、娄底4市16所中学进行,获有效样本2006份,其中各区人数分别为504、512、538、452人,男女生分别为888人和1113人,7~12年级学生分别为313、349、316、352、346、330人。结果:中学生学习策略量表由两个分量表、42个项目构成;正式问卷中自编项目31个,自编率达到了73.8%;IRT等级展开模型的项目分析显示项目位置参数位于(-0.62,0.26)之间,区分度参数位于(0.61,2)之间,测验整体和各项目的拟合度均良好;总量表α系数为0.90,重测信度为0.64,验证性因素分析表明两个分量表各项指标的模型拟合度良好。结论:中学生学习焦虑综合量表符合测量学的基本要求,并具有良好的自主性。 相似文献
20.
本文主要说明了在.NET架构下的自定义组件开发技术应用于IRT自适应考试系统的方法.以能力估值自定义组件开发过程的介绍,阐述了.NET自定义组件开发的基本过程和方法,最后对能力估值组件应用推广进行展望. 相似文献