期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

闫成海杜文久宋乃庆张健《华东师范大学学报(教育科学版)》2014,32(3):10-18

相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度。实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景。相似文献

2.

影响项目反应理论等值效果的因素探查

丁树良熊建华戴海琦《中国考试》2005,(1):25-26

1前言测验等值是对考核同一心理品质的多个测验形式系统地做出测验分数转换．从而使不同测验形式的测验分数之间具有可比性。由于项目反应理论(IRT)将项目难度与心理特质(能力)定义在同一量表上，故也可以认为IRT中的等值是将考核同一心理品质的多个测验形式系统地做出项目参数转换．从而使不同测验形式中的项目参数之间具有可比性。相似文献

3.

CTT与IRT下的合格分数确立方法——测验公平性中的一个技术问题

邓远平《湖北招生考试》2006,(20)

如何确立标准参照测验中的合格分数是涉及到测验公平性的一个技术问题,介绍与之相关的经典测验理论(CTT)下的被试组对比判断法、测验内容分析判断法,项目反应理论(IRT)指导下的确立方法等,以期对广大考试工作者有所借鉴与启示。相似文献

4.

跨年级小学生数学学力认知诊断测验的IRT垂直等值分析

王欣瑜《中国考试》2021,(2)

本研究采用“共同题?锚测验”设计,使用R语言ltm程序包中的IRT两参数模型进行各年级小学生数学学力认知诊断测验和被试参数的估计,并使用equateIRT程序包进行跨年级小学生数学学力认知诊断测验各项参数的等值转换。结果表明,等值转换后各年级测验的题目难度和小学生数学学力均随年级增长而逐渐递增,不同学校、民族、性别学生的数学学力发展差异性特征均与理论假设相符。本研究验证了采用IRT垂直等值方法构建跨年级小学生数学学力发展水平垂直量表的可行性,为制定系统性补救教学方案和自适应题库建设提供了必要的实证证据。相似文献

5.

CTT和IRT在项目编制中的参数比较

李映红《教育测量与评价(理论版)》2009,(4):8-10

目的：比较CTT和IRT项目参数的相关性及各自的特点。方法：选取200个项目、480名被试,分别求出CTT的难度和区分度,用ANOTE软件求出IRT的三参数逻辑斯蒂克模型中的a、b、c参数以及能力值为-0．475的信息量,对CTT和IRT的参数值分别进行spearman相关分析。结论：CTT中的难度和区分度分别与IRT中的b参数和a参数有较高的一致性,CTT中的难度与IRT中的C参数有显著的负相关;IRT中的信息量受参数a、b、c三者的影响。相似文献

6.

国家通用语言测验题库的构建探索

任杰黄金娜杨翊彭恒利《中国考试》2023,(12):47-54

民族地区国家通用语言测验题库的创建是一个系统工程。在构建题库的过程中,首先要制定题库的描述性参数体系,并以能力维度和文本维度标注所有试题。之后是确定最优的IRT统计参数估计模型和等值参数转换方法为Logistic双参数模型和同时校准法,使得试题的IRT统计参数能够统一到一个量表上。最终构建的题库由50多套试卷的试题及其描述性参数和统计参数构成,涵盖测验所需测查的各种能力和文本,各项参数指标良好,能够保证测试的有效性和高信度。相似文献

7.

IRT理论不同模型下同时校准等值方法的跨样本研究

《中国考试》2016,(2)

本研究基于IRT理论中最常用的LOGISTIC三种模型来探讨等值的跨样本一致性,研究对象为某一汉语类别的测验,等值方法采用同时校准法。研究结果表明,双参数模型下同时校准法等值跨样本一致性最好,最为稳定。相似文献

8.

铆测验设计下确定IRT等值常数的新方法 总被引：3，自引：0，他引：3

陈希镇《中国考试》2006,(5):39-42

本文研究铆测验设计下确定IRT等值常数的新方法,提出估计等值常数的新公式,该估计公式具有鲜明的统计意义,充分利用从项目数据得出的难度、区分度估计值,同时具有计算简便的优点。相似文献

9.

CFA与EFA在IRT单维性检验方面的应用比较

杨志明《中国考试》1998,(1)

一、导言测验的单维性假设是 IRT 使用的前提条件之一。单维性假设如果得不到满足,IRT 的优点便不复存在。甚至可能导致错误结论。因此,单维性问题一直受到测量学家们的关注。什么是测验的单维性假设呢?简单地说,测验的单维性是指一个测验只测查了一种或主要是一种潜在的心理特质或能力,其他任何因素都不会影响被试在该题目上的作答反应的特性。即该测验的完全潜在特质空间是一维的。这里,完全潜在特质空间指的是这样一种空间,“它包含影响被试题目反应水平的所有‘重要的’心理特质,但不包括那些反应‘测量误差’的变量。” 相似文献

10.

对基于项目反映理论的计算机自适应测试方法的再思考

刘培艳王淑琴《唐山师范学院学报》2013,(2):44-46

以项目反应理论IRT（ItemResponseTheory）为基础,介绍项目反应理论IRT的特点,以及基于项目反应理论IRT的计算机自适应测试的工作原理,并在此基础上总结了起点选择的方法,提出了测试流程两步制的改进方案,通过对测试流程的改进,大大减少了与被试能力值相差较远的测试项目,缩短了测试时间和计算量,同时能准确地估计被试能力值。相似文献

11.

基于混合IRT的潜在转变模型研究进展

《考试研究》2018,(1)

潜在转变分析是一种用于处理纵向数据的分析方法,可以估计出个体在不同时间点的潜在状态变化,从转变率的角度研究个体发展的阶段性。本文从潜在转变模型发展的角度对基于混合IRT的潜在转变模型进行了系统阐述,总结出了基于混合项目反应理论的潜在转变(LTAMix IRT)模型、多水平LTA-Mix IRT模型以及多分属性的LTA-Mix IRT模型,对LTA-Mix IRT模型形成的理论基础、转变机制、模型的特性与应用等方面的内容进行了重点论述。最后指出了该模型的发展与应用前景,为后续的研究提供参考。相似文献

12.

新疆学业水平质量监测汉语试卷的纵向量表化实证研究

《中国考试》2014,(7)

作为一种典型的增长模型,纵向量表化(Vertical Scaling,也称垂直等值、垂直标定等)方法常用于评估被试的学业或能力发展状况。本研究以新疆少数民族四至六年级学生在2011年至2013年三次学业水平质量监测汉语考试中的答题数据为样本,采取共同题设计进行数据收集,并运用Thurstone方法和IRT同时标定的方法进行量表分数构建,最终完成了三个年级间的分数连接,实现了对新疆双语班四至六年级学生汉语学业水平增长的测量,为学业水平监测工作提供了可参考的量化指标。相似文献

13.

小学学业成就评价方法探新——项目反应理论(IRT)指导下的计算机自适应测验(CAT)

李映红《湖南第一师范学报》2007,7(3):31-33

好的评价方法能给学生学业成就科学公正的评价,可以正确引导学生找出不足,激励学习。根据小学学业成就评价方法的现状,对照传统的CTT理论和现代测量理论IRT的优缺点,提出项目反应理论(IRT)指导下的计算机自适应测验(CAT)作为传统测验的一种辅助方式,应用于小学学业成就评价中是必要的,也是可行的。相似文献

14.

面试前有关被试的心理测验信息对考官面试评价的影响研究 总被引：1，自引：0，他引：1

刘远我《中国考试》2008,(4)

面试作为一种常用的人事选拔技术正受到研究者的日益关注。本研究考察了面试前有关被试的测验信息对考官面试评价的影响,结果表明,这种影响是存在的,特别是消极的测验信息对面试评价的影响更大,同时测验信息对面试新手评价的影响比对有经验的人事工作者来说更大。不同种类的测验信息对面试评价的影响不同,能力测验的信息对面试评价的影响比个性测验大,同时能力测验信息并不是只对与其相关的能力维度的面试评价有影响,而是对各个维度的面试评价产生广泛的影响。相似文献

15.

面试前有关被试的心理测验信息对考官面试评价的影响研究

刘远我《中国考试》2009,(5)

面试作为一种常用的人事选拔技术正受到研究者的日益关注,本研究考察了面试前有关被试的测验信息对考官面试评价的影响,结果表明,这种影响是存在的,特别是消极的测验信息对面试评价的影响更大,同时测验信息对面试新手评价的影响比对有经验的人事工作者来说更大。不同种类的测验信息对面试评价的影响不同,能力测验的信息对面试评价的影响比个性测验大,同时能力测验信息并不是只对与其相关的能力维度的面试评价有影响,而是对各个维度的面试评价产生广泛的影响。相似文献

16.

项目反应理论测验信度及其研究述评

陈士奇戴海琦《考试研究》2013,(6):65-72

项目反应理论下的测验信度能够评价潜在特质估计的可靠性与稳定性,由于具有宏观性的特点,项目反应理论信度的作用并不能被测验信息函数所取代,是IRT测验的一个重要指标。本文参考国内外文献,首先介绍国内外学者关于IRT信度作用的观点,并介绍和评价了多种IRT信度估计方法,然后简要介绍IRT信度的影响因素,最后展望了IRT信度领域后续研究尚可着力之处。相似文献

17.

基于WEB的计算机自适应考试系统的设计与实现

刘发明《赣南师范学院学报》2005,26(6):64-66

介绍了项目反应理论(IRT)的基本理论和计算机化自适应测试(CAT)的实现过程。并在Visual Stu-dio.net2003的环境下,以SQL作为后台数据库,以三参数Logistic模型为项目反应模型,开发了一个基于WEB的CAT系统。相似文献

18.

应用于考试中的IRT参数估计简化程序设计

朱宁宁《中国考试》2003,(5):11-12

目前,越来越多的考试都应用项目反应理论(Item Response Theory,称简IRT)作为题目分析、题库建设以及分数估计等方面的主要方法。但是,这一方法因为具有太多的数理统计内涵,以至不容易被人掌握。而且,目前用于IRT参数估计的软件虽然不少,比如有BIGSTEPS、PARSCALE、BILOG以及MULTILOG等(Embretson & Reise,2000),但是作为商业软件,这些工具都有特定的应用范围和条件,并且功能过于复杂,设计的目的主要相似文献

19.

IRT等级展开模型在中学生学习焦虑综合量表编制中的应用

范晓玲郑岱卢谢峰《教育测量与评价(理论版)》2014,(12):4-8

目的：运用IRT等级展开模型编制中学生学习焦虑综合量表,为中学生学习焦虑的评估、咨询与辅导提供工具,并探讨中学生学习焦虑理论结构。方法：采用理论与实践相结合的方法构建中学生学习焦虑结构,并在文献、访谈和问卷调查的基础上,构建中学生学习焦虑项目库,经两次测试与项目筛查,确定正式量表。取样在湖南省长沙、邵阳、岳阳、娄底4市16所中学进行,获有效样本2006份,其中各区人数分别为504、512、538、452人,男女生分别为888人和1113人,7~12年级学生分别为313、349、316、352、346、330人。结果：中学生学习策略量表由两个分量表、42个项目构成;正式问卷中自编项目31个,自编率达到了73.8%;IRT等级展开模型的项目分析显示项目位置参数位于（-0.62,0.26）之间,区分度参数位于（0.61,2）之间,测验整体和各项目的拟合度均良好;总量表α系数为0.90,重测信度为0.64,验证性因素分析表明两个分量表各项指标的模型拟合度良好。结论：中学生学习焦虑综合量表符合测量学的基本要求,并具有良好的自主性。相似文献

20.

基于.NET的自适应考试系统组件开发

白宇《考试周刊》2008,(43)

本文主要说明了在.NET架构下的自定义组件开发技术应用于IRT自适应考试系统的方法.以能力估值自定义组件开发过程的介绍,阐述了.NET自定义组件开发的基本过程和方法,最后对能力估值组件应用推广进行展望. 相似文献