首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
目的:比较CTT和IRT项目参数的相关性及各自的特点。方法:选取200个项目、480名被试,分别求出CTT的难度和区分度,用ANOTE软件求出IRT的三参数逻辑斯蒂克模型中的a、b、c参数以及能力值为-0.475的信息量,对CTT和IRT的参数值分别进行spearman相关分析。结论:CTT中的难度和区分度分别与IRT中的b参数和a参数有较高的一致性,CTT中的难度与IRT中的C参数有显著的负相关;IRT中的信息量受参数a、b、c三者的影响。  相似文献   

2.
项目反应理论下的测验信度能够评价潜在特质估计的可靠性与稳定性,由于具有宏观性的特点,项目反应理论信度的作用并不能被测验信息函数所取代,是IRT测验的一个重要指标。本文参考国内外文献,首先介绍国内外学者关于IRT信度作用的观点,并介绍和评价了多种IRT信度估计方法,然后简要介绍IRT信度的影响因素,最后展望了IRT信度领域后续研究尚可着力之处。  相似文献   

3.
本文基于经典测量理论(CTT)和项目反应理论(IRT),对湖北省某地区的高中数学试卷是否符合命题规则和考核目标进行质性分析,同时根据考生的作答情况对试题进行量化分析。结果表明,使用IRT的能力参数能更加全面真实地反映学生的能力水平;教师在教学过程中对学生应用能力的培养不够。  相似文献   

4.
好的评价方法能给学生学业成就科学公正的评价,可以正确引导学生找出不足,激励学习。根据小学学业成就评价方法的现状,对照传统的CTT理论和现代测量理论IRT的优缺点,提出项目反应理论(IRT)指导下的计算机自适应测验(CAT)作为传统测验的一种辅助方式,应用于小学学业成就评价中是必要的,也是可行的。  相似文献   

5.
单维非参数项目反应理论(NIRT)假设数据满足单维性、单调性和局部独立性三个假设,不要求数据拟合某种特殊的函数形态。非参数高斯核平滑法能根据数据本身的特点,构拟NIRT的项目反应函数,估计被试的潜在能力值。实验模拟了42套拟合单维双参数逻辑斯蒂模型的数据,比较了非参数高斯核平滑法在题量和被试样本数2个因素不同水平下估计被试能力值的精度。结果表明:样本数对方法的估计精度没有显著影响;题量的增加能较好改善估计的精度。在测试实践中,应采用不同的题量设计,以满足估计精度的要求。  相似文献   

6.
目的:与经典测量理论相比,项目反应理论具有更多的优势,但由于项目反应理论模型的复杂性,进行参数估计时往往需要较大的被试样本;人工神经网络的出现为小样本被试估计项目反应理论的能力参数和项目参数提供了可能,文章的目的是通过神经网络的蒙特卡罗模拟研究寻找更精确的参数估计方法。方法:以项目反应理论的两参数模型为例,以MAB和RMSE为比较指标,通过模拟数据比较经典测量理论的通过率、点二列相关系数、平均得分作为神经网络的输入值与以经过转换的数值(IRT参数估计的初值)作为神经网络的输入值训练网络结果的差异,比较不同条件下MAB指标和RMSE指标的差异。结果:以通过率估计项目参数b与以 bj=zj/rbj估计项目参数b存在差异;以点二列相关系数估计项目参数a与以 aj=rbj/ 1-r2bj(1/2)估计项目参数a存在差异;以平均得分估计能力参数θ与以 ln[ x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以 bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数 a 比以 aj=rbj/ 1-r2bj(1/2)估计项目参数a存在差异;以平均得分估计能力参数θ与以 ln[ x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以 bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数 a 比以 aj=rbj/ 1-r2bj(1/2)估计项目参数 a 误差更大,以平均得分估计能力参数θ比以ln[ x/(m-x)]估计能力参数θ误差更大。  相似文献   

7.
信度是衡量测量结果稳定性与可靠性的重要指标,反映了测量过程中对误差控制能力的大小。信度分析是自学考试试题评价的重要内容,包括测量分数信度分析与及格线决策信度分析。本文简要介绍了CTT信度观、GT信度观及IRT信度观的理论内容与信度分析方法,并对三种测量信度观进行比较。本文提出,自学考试的信度分析工作应结合具体课程的考试特点、试卷结构、考试作答数据类型等因素,同时考虑CTT、GT、IRT三种信度观的优势及信度估计方法的应用条件,根据具体研究目的选择最恰当的或综合运用不同的信度分析方法。  相似文献   

8.
水研究通过对全国和广东省部分高考科目考试分数的统计分析,分别研讨了经典测验理论(CTT)与题目反应理论(IRT)在我国考试改革中应用的若干问题, 在多个方面作了分析与比较,并重点研究了IRT实际应用的若干问题.  相似文献   

9.
潘浩 《考试研究》2014,(2):59-63
早期的单维IRT模型忽视了测验多维性的可能,而多维IRT模型对各维度的划分不够明确,不能很好地反映各维度能力的内涵。高阶IRT模型承认测验的多维性,以分测验划分维度,同时又将多个维度的能力统一到一个高阶的能力中,能够在了解被试各维度的能力同时,为被试提供整体的能力估计,它能更好地反映实际,并且适应大规模测验的需求。  相似文献   

10.
七十年代以来,项目反应理论(ItemResponse Theory,IRT)成了测量专家关心的主要课题之一。IRT中单参数Log-istic模型常称为Rasch模型,它是由丹麦数学家Georg Rasch沿着与其他项目反应模型非常不同的路线推导出来的本文旨在介绍Rasch模型在实际中的一些应用和一种模型参数的估计方法。这种方法可以借助于手算完成,从而使普通中学老师也可以作一些IRT的题目分析工作。一、模型及其应用IRT理论认为,潜在能力测量模型至少应该包括被测对象(考生)的行为反应与潜在能力的度量。前者是可观察的,后者是待估计的。Rasch模型可以表示为  相似文献   

11.
本文旨在基于项目反应理论(IRT),以高中三角函数为例,编制了一份诊断性测试卷.首先根据课标、考试大纲等文本材料确定三角函数考试要点,从历年高考试题中选取了15个项目,对40名学生进行预测试,发现项目1的难度参数为-8.99,不在(-3,3)内,且其项目信息函数曲线出现异常,予与删除,同时也说明项目反应理论克服了经典测量理论的缺点,在诊断性测试卷的编制上具有突出优势.  相似文献   

12.
测验等值无疑是测量中一个重要问题。《面向心理学家的项目反应理论》一书指出,“项目反应理论(IRT)最初吸引美国测验编制人员。是因为这种理论可以解决许多测验中的实际问题,比如将不同形式的测验形式等值。”《BILOG.3使用说明书》指出,“IRT与经典测验理论(CTT)相比,或许最大的长处是测验等值”。事实上,在IRT框架下实施等值,不仅理论完善,前提条件较容易满足,而且等值关系式也十分简洁。  相似文献   

13.
以项目反应理论IRT(ItemResponseTheory)为基础,介绍项目反应理论IRT的特点,以及基于项目反应理论IRT的计算机自适应测试的工作原理,并在此基础上总结了起点选择的方法,提出了测试流程两步制的改进方案,通过对测试流程的改进,大大减少了与被试能力值相差较远的测试项目,缩短了测试时间和计算量,同时能准确地估计被试能力值。  相似文献   

14.
1前言 测验等值是对考核同一心理品质的多个测验形式系统地做出测验分数转换.从而使不同测验形式的测验分数之间具有可比性。由于项目反应理论(IRT)将项目难度与心理特质(能力)定义在同一量表上,故也可以认为IRT中的等值是将考核同一心理品质的多个测验形式系统地做出项目参数转换.从而使不同测验形式中的项目参数之间具有可比性。  相似文献   

15.
PISA的数学测试和高考数学考试,虽然测试的内容不同、考生的年龄不同,但测试目的相近或类似,测试了数学的基本素养和应用数学知识解决问题的能力。同时反映了数学作为学习和研究现代科学技术必不可少的基本工具,在测试中具有稳定、有效的特点,受地区差异和文化差异的影响较小,甚至受到考查年限的跨度影响也较小。PISA和高考中的数学测试反映了在数学能力考查上,虽然命题的形式有所不同,但评价结果仍有较高一致性,考查效果高度相关。  相似文献   

16.
本研究应用Caojing等人的Bayesian IRT Guessing系列模型,分析初中二年级学生在汉语词汇测验中的猜测行为,使用DIC3指标评价模型的拟合程度,并将参数估计结果与双参数Logistic模型进行了比较。研究发现:(1)猜测模型的拟合度优于双参数Logistic模型;(2)初中二年级测验数据最适合临界猜测模型(IRT-TG),约有3.5%的学生存在TG型猜测行为;(3)猜测者的存在会明显影响本身的能力估计与项目难度估计,但是对非猜测者的能力及区分度参数估计影响不大。  相似文献   

17.
以山东省某综合型普通本科院校为例,采用实证研究的方法探求高考与大学生学业成绩的Pearson线性相关分析与Copula函数非线性相关分析,结果显示两者具有较弱的相关性。表明高中数学教育及高考数学考试与大学数学教育及考查有很大不同,研究结果为我国改革高考制度和中学数学教育提供了现实依据。  相似文献   

18.
基于项目反应理论(IRT),采用离差加权值最小和测验项目信息函数值最高两个目标规划相结合的办法,设计了一个新的自动组卷数学模型。该模型克服了经典测量理论(CTT)的种种局限,有效解决了计量指标——信息量与非计量指标——题型分布、知识点分布等约束条件计算量纲不同的问题,很好地体现了测试项目信息函数值最高的组卷目标。  相似文献   

19.
中考是各地区规模较大和有影响力的高利害性考试,只有建立科学完善的考试评价系统才能充分发挥中考对地区初中教学多方面的服务作用,而建立完善考试评价系统的必备程序是等值。IRT等值的步骤包括估计项目参数、进行IRT量表转换以及制作分数转换表。  相似文献   

20.
概化理论(Generalizability Theory)是当今最重要的三大测验理论之一,与经典测验理论(Classical Test Theory,CTT)和项目反应理论(Item Response Theory,IRT)相比,不仅信度观为人乐道,而且效度观也令人耳目一新。为了更好地把握测量效度,本文将从二个方面讨论一下概化理论的效度观。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号