首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 27 毫秒
1.
目前IRT参数估计程序大多数都要求大样本容量,而基于小样本容量的IRT参数估计系统非常少,但在测验实践中小样本容量的情况经常出现.本文根据测验的实际和对IRT参数估计方法的比较研究设计开发了一个基于小样本容量的IRT参数估计系统.该系统界面友好,操作简单,估计精度高,有一定的应用推广价值.  相似文献   

2.
广义指数分布是应用非常广泛的一种分布,近年对该分布的讨论主要是常规寿命试验数据的统计分析方法,研究重点是参数的点估计.但基于不完全样本、应用TFR模型、探讨广义指数分布在步加试验中的参数估计的文献却很少见.对此,利用EM算法给出了参数估计的显性表达式,并通过数据模拟说明了估计方法的可行性.  相似文献   

3.
本研究基于IRT理论中最常用的LOGISTIC三种模型来探讨等值的跨样本一致性,研究对象为某一汉语类别的测验,等值方法采用同时校准法。研究结果表明,双参数模型下同时校准法等值跨样本一致性最好,最为稳定。  相似文献   

4.
本研究应用Caojing等人的Bayesian IRT Guessing系列模型,分析初中二年级学生在汉语词汇测验中的猜测行为,使用DIC3指标评价模型的拟合程度,并将参数估计结果与双参数Logistic模型进行了比较。研究发现:(1)猜测模型的拟合度优于双参数Logistic模型;(2)初中二年级测验数据最适合临界猜测模型(IRT-TG),约有3.5%的学生存在TG型猜测行为;(3)猜测者的存在会明显影响本身的能力估计与项目难度估计,但是对非猜测者的能力及区分度参数估计影响不大。  相似文献   

5.
混合weibull分布是可靠性分析中的一类重要的分布,假设样本服从二重混合weibull分布,即可给出后验参数估计.本文采用基于Gibbs抽样的马尔科夫链蒙特卡罗方法(MCMC),设计了用于参数Bayes估计的抽样方案,通过模拟研究,与EM方法进行比较.结果显示,采用Bayes方法估计参数具有一定的优越性.  相似文献   

6.
为解决在定数截尾的情况下混合weibull分布的参数估计问题,给出了混合weibull分布的后验参数估计形式,设计了用于参数Bayes估计的Gibbs抽样方案.通过随机模拟,结果显示,采用Gibbs抽样算法的参数估计具有一定的有效性和良好的稳定性,特别在样本较少的情况下优于使用EM算法的估计结果.  相似文献   

7.
目的:与经典测量理论相比,项目反应理论具有更多的优势,但由于项目反应理论模型的复杂性,进行参数估计时往往需要较大的被试样本;人工神经网络的出现为小样本被试估计项目反应理论的能力参数和项目参数提供了可能,文章的目的是通过神经网络的蒙特卡罗模拟研究寻找更精确的参数估计方法。方法:以项目反应理论的两参数模型为例,以MAB和RMSE为比较指标,通过模拟数据比较经典测量理论的通过率、点二列相关系数、平均得分作为神经网络的输入值与以经过转换的数值(IRT参数估计的初值)作为神经网络的输入值训练网络结果的差异,比较不同条件下MAB指标和RMSE指标的差异。结果:以通过率估计项目参数b与以 bj=zj/rbj估计项目参数b存在差异;以点二列相关系数估计项目参数a与以 aj=rbj/ 1-r2bj(1/2)估计项目参数a存在差异;以平均得分估计能力参数θ与以 ln[ x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以 bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数 a 比以 aj=rbj/ 1-r2bj(1/2)估计项目参数a存在差异;以平均得分估计能力参数θ与以 ln[ x/(m-x)]估计能力参数θ存在差异。结论:对于两参数项目反应模型,以通过率估计项目参数b比以 bj=zj/rbj估计项目参数b误差更小,而以点二列相关系数估计项目参数 a 比以 aj=rbj/ 1-r2bj(1/2)估计项目参数 a 误差更大,以平均得分估计能力参数θ比以ln[ x/(m-x)]估计能力参数θ误差更大。  相似文献   

8.
相关研究表明,IRT在教育考试评价中比CTT具有诸多优点。本文以某地区高考数学考试数据为基础,比较CTT与IRT在项目参数、评价方式、精度估计三个方面之间的差异。研究结果证明,在IRT下参数更容易反映观测各个项目的特征属性,IRT参数比CTT参数更具精确性,项目信息函数能更好的反映试题信息;CTT与IRT的评价方式不同,IRT下的能力分数优于CTT下的测验分数,更能反映学生能力水平;CTT与IRT精度估计不同,IRT测验信息函数和能力置信区间比CTT有更好的精度。实证展示出IRT在高考数学考试评价中的优越性,具有重要的价值和应用前景。  相似文献   

9.
民族地区国家通用语言测验题库的创建是一个系统工程。在构建题库的过程中,首先要制定题库的描述性参数体系,并以能力维度和文本维度标注所有试题。之后是确定最优的IRT统计参数估计模型和等值参数转换方法为Logistic双参数模型和同时校准法,使得试题的IRT统计参数能够统一到一个量表上。最终构建的题库由50多套试卷的试题及其描述性参数和统计参数构成,涵盖测验所需测查的各种能力和文本,各项参数指标良好,能够保证测试的有效性和高信度。  相似文献   

10.
《现代教育技术》2019,(5):92-98
文章对计算机自适应测试中常用的参数估计法——联合极大似然估计(Joint Maximum Likelihood Estimation,JMLE)法进行了改进,提出了一种基于三值矩阵的联合参数估计方法——3V-JMLE法。基于此,文章以作答反应数据库中被试作答信息为样本,分别采用JMLE法、3V-JMLE法进行参数估计,其对比结果表明:在理想作答矩阵下,3V-JMLE法和JMLE法具有同等的参数估计精度和计算效率;在非理想作答矩阵下,采用JMLE法进行参数估计存在一定的局限性,而采用3V-JMLE法具有很高的参数估计精度并大大提高了计算效率。3V-JMLE法的提出,对于联合参数估计方法的实际估计参数过程有重要指导意义。  相似文献   

11.
《滁州学院学报》2017,(5):55-58
传统的时间序列分析与预测方法没有考虑样本和参数的先验信息,导致预测结果和实际数据的偏差较大,贝叶斯参数估计方法可以充分利用参数的先验信息,使得估计参数的方差更小,估计结果更加精确,预测结果更真实有用。随着MCMC方法和WinBUGS软件的发展,贝叶斯分析方法估计模型的计算困难逐渐减弱,因此,近年来贝叶斯时间序列预测方法越来越受到关注。本文基于上证指数收盘价的数据,采用Eviews和WinBugs软件,对样本数据进行预处理,利用贝叶斯参数估计方法进行时间序列自回归模型的实证研究分析。  相似文献   

12.
探讨了几种常用的基于项目反应理论(IRT)的试题参数估计方法,并分析了每一种估计方法的优缺点及各自的适用领域,为构建基于IRT的试题库系统提供理论参考.  相似文献   

13.
对IRT模型应用中须注意的几个重要问题做了分析与探讨,包括模型的假设,模型的拟合,模型对样本大小的要求等,虽然分析与探讨这些问题时主要以单维参数IRT模型为焦点,但非参数IRT模型以及多维IRT模型的应用也同样涉及这些问题。这些模型拥有某些特别的优势,在某些情况下应用是恰当的,但在健康评估领域并不是全部适用。  相似文献   

14.
近年来关于DINA模型的相关研究显示,样本量、先验分布、经验贝叶斯或完全贝叶斯估计方法、样本的代表性、项目功能差异和Q阵误指等,均可能是导致DINA项目参数估计发生偏差的原因。使用Monte Carlo模拟试验,对DINA项目参数(猜测参数和失误参数)的组合变化类型和偏差量进行考察,通过条件极大似然估计法估计知识状态,发现项目参数估计值与真值偏差不大时,对知识状态估计的精度影响不大;但是项目参数偏离真值较大时,尤其是在三种组合类型上,对属性掌握存在明显的高估或低估现象。研究结果对于诊断测验等值有一定的启示:若两个测验上锚题的项目参数出现了较大的偏差(0.1),则需要考虑等值的必要性。  相似文献   

15.
病态矩阵是IRT理论中项目参数估计必然面对的问题.本文以2PLM参数估计为例.推导出参数估计迭代公式,系统阐述了三种病态控制方法的原理及在编程中数据处理的技巧。  相似文献   

16.
为比较结构方程模型和 IRT等级反应模型在人格量表项目筛选上的作用,以《中国大学生人格量表》的7229个实际测量数据为基础,针对因素二“爽直”分别以Lisrel8.70和Multilog7.03进行结构方程模型和等级反应模型的参数估计与拟合,比较两种方法的项目筛选结果.二者统计结果均认为项目5、6、7、8拟合度不佳,在结构方程模型上表现为因子负荷较低,整体拟合指数不理想;在等级反应模型上表现为区分度参数和位置参数不理想,相关项目的特征曲线和信息曲线形态较差.但结构方程模型倾向于项目6、8更差,而等级反应模型则倾向于项目5、6更差.结构方程模型和 IRT等级反应模型对人格量表项目的统计推断结果从总体上讲是一致的,但在个别项目上略有差异.二者各有优势,可以结合使用.  相似文献   

17.
最小二乘参数估计的递推算法是系统参数辨识中最基本、最成熟的方法。文章首先介绍了最小二乘法的递推算法原理和本识别系统的框架流程图,然后针对文章的算法分别阐述了服从N(0,1)正态分布自相关随机噪声v(k)的产生方法。文章着重介绍了利用C语言编程对一个简单系统的参数辨识实现最小二乘参数估计的递推算法,详细说明了本系统各个环节的C语言实现,并通过matlab仿真对数据进行了详细的分析。从仿真实验结果可以看出,试验数据符合试验要求,系统的参数辨识实现最小二乘参数估计的递推算法的效果令人满意。  相似文献   

18.
测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。  相似文献   

19.
本文采用共同题非等组设计,对五种基于IRT的项目参数等值方法进行比较研究。研究数据来自湖北某试点地区课改实验区和非课改区考生在标准化中考数学科目的考试数据,兼用大样本标准和其他标准作为各等值方法比较的检验标准,以RMSD指标作为操作性检验标准,利用STUIRT程序进行等值分析。研究结果表明,针对本研究所设置的等值情境,MS方法稳健性最差,对于项目难度参数的等值,同时校准方法最好,其次是SL特征曲线法,对于项目区分度参数的等值,MM方法精确性最好。  相似文献   

20.
目的:比较CTT和IRT项目参数的相关性及各自的特点。方法:选取200个项目、480名被试,分别求出CTT的难度和区分度,用ANOTE软件求出IRT的三参数逻辑斯蒂克模型中的a、b、c参数以及能力值为-0.475的信息量,对CTT和IRT的参数值分别进行spearman相关分析。结论:CTT中的难度和区分度分别与IRT中的b参数和a参数有较高的一致性,CTT中的难度与IRT中的C参数有显著的负相关;IRT中的信息量受参数a、b、c三者的影响。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号