首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
与传统测量模型相比,Rasch模型因其客观和等距的特点在试卷质量分析中独具优势。本文以南京市小学科学六年级技术与工程素养评测试卷的质量分析为例,从试卷整体质量检验、单维性检验、试卷难度与学生能力的匹配性检验、各题质量分析、题目拟合度和测量误差检验等方面介绍了Rasch模型在试卷质量分析中的应用,同时指出该评测试卷的信效度较高、题目区分度合理,绝大多数题目达到了测量预期。在具体应用中,测量者应依据实际情况选择合适的Rasch分析软件及Rasch模型对应的分析功能;在Rasch模型检测出试卷中的问题项目后,测量者应依据实际情况解释和处理这些问题项目。  相似文献   

2.
化学测试是化学课程实施的重要组成部分,对测试试卷质量进行客观、科学的分析具有重要意义.客观、等距性的Rasch模型在试卷质量分析应用中显示出传统测量模型不具备的优势.以某市一次中考化学模拟试题分析为例,从Rasch检验指标及特征量、试卷整体质量、单维性检验、拟合度、测量误差检验和被试水平与项目难度匹配性检验五个方面阐述了Rasch模型在化学试卷质量分析中的应用,并讨论了应用过程中应注意的问题.期望为一线教师进行试卷分析提供新的技术参考.  相似文献   

3.
为克服经典测量理论存在的测量依赖性和样本依赖性,本研究将Rasch模型应用于小学六年级学生科学素养评测的质量分析中,从整体质量检验、单维性检验、怀特图、单题质量分析、气泡图等方面介绍了Rasch模型在质量分析中的应用。同时指出该评测设计的题目信效度高、区分度合理,绝大多数题目达到了测量预期。Rasch模型在评测设计中的应用,为评测设计提供了一定的测量质量数据的参考。  相似文献   

4.
Rasch模型已经被广泛的应用于教育测量领域,在考试相关的各个方面都产生了重大的影响。拟合统计量分析是应用Rasch模型的一个重要环节,在Rasch分析中起着关键的作用。本文以PETS为例,介绍了Rasch拟合统计量的特点和类别、实际使用方法及其局限性。  相似文献   

5.
Rasch测量原理及在高考命题评价中的实证研究   总被引:1,自引:1,他引:1  
王蕾 《中国考试》2008,(1):32-39
Rasch测量是当前教育与心理测量中具有客观等距量尺的测量。克服了经典测量的测验工具依赖和样本依赖的局限。本文通过介绍Rasch测量原理及其在高考命题评价考生抽样数据分析上的具体应用,为教育决策者和命题者提供了直观的Rasch测量对高考命题评价的量化图形表现形式。希望Rasch测量能在高考抽样数据分析中为命题量化评价提供新的、有价值的思考方式,能被教育决策者和命题者认同和有效使用。  相似文献   

6.
客观等距量尺在高考评价指标体系中的应用与构想   总被引:1,自引:0,他引:1  
客观等距量尺指标研究对改进和完善现行高考抽样调查问卷提供了新的思考方式。基于2007年高考抽样调查问卷和收集到的相关数据,应用Rasch测量客观等距量尺简单化假设出"高考反映考生真实学习状况"评价量尺指标.实证性展示了Rasch测量客观等距量尺分析模式和2007年12个抽样省市数据客观描述。最后探讨了基于高考客观等距量尺评价指标体系开展教育质量评价的构想。  相似文献   

7.
多面Rasch模型(MFRM)是Rasch单参数模型的延伸,对于检测不同测量层面一致性差异具有很好的支持作用。本文聚焦于运用多面测量模型的分析软件FACETS,重点阐述如何利用TXT数据文件和Excel数据文件生成控制数据文件的方法步骤。力求通过详细的过程介绍并配合图文说明,使学习者对Facets控制数据文件生成有更加清晰的认识,为后续应用Rasch模型开展数据分析奠定基础。  相似文献   

8.
七十年代以来,项目反应理论(ItemResponse Theory,IRT)成了测量专家关心的主要课题之一。IRT中单参数Log-istic模型常称为Rasch模型,它是由丹麦数学家Georg Rasch沿着与其他项目反应模型非常不同的路线推导出来的本文旨在介绍Rasch模型在实际中的一些应用和一种模型参数的估计方法。这种方法可以借助于手算完成,从而使普通中学老师也可以作一些IRT的题目分析工作。一、模型及其应用IRT理论认为,潜在能力测量模型至少应该包括被测对象(考生)的行为反应与潜在能力的度量。前者是可观察的,后者是待估计的。Rasch模型可以表示为  相似文献   

9.
Rasch模型在研究生入学考试质量分析中的应用   总被引:1,自引:0,他引:1  
运用Rasch模型对2010年全国硕士研究生入学考试心理学专业基础综合考试进行分析。结果表明,该试题总体上是一套高质量的测验,试题的内容覆盖了所有能力水平的考生,且能够较好地区分考生的能力水平,达到了预期的选拔目的。但通过Rasch分析也发现,在试题中有个别题目没有达到预期的测量目标,可以考虑在今后的工作中对其做出相应的修改。基于Rasch模型的试题分析能为考生能力和试题质量分析提供更多的测量信息。  相似文献   

10.
针对影响演讲比赛打分结果的各种误差来源,本文引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用不但有利于有效测量考生的能力水平,而且为识别问题评委、完善评分规则、及评委培训等问题都提供了全新的解决思路。本文同时也介绍了多面Rasch模型的理论及其在演讲比赛评分中的应用框架。  相似文献   

11.
Rasch模型应用在试卷质量分析中有如下方法:怀特图(Wright Map)——让读者对试卷的整体情况有一个大致地了解;多维性检验(Multidimensionality Investigations)——考查试卷是否测量被试的同一潜在特质(即阅读能力);项目拟合和误差统计(ITEM:fit order)、气泡图(Bubble Diagram),等等。文章以广西壮族自治区五六年级学生阅读素养前测试卷的质量分析为例,呈现了Rasch模型测评的过程。测评表明,该试题总体上是一套高质量的试卷,试题项目覆盖了所有能力水平的被试,难度编制合理,绝大多数题目达到了预期的测验效果。然而,由于测量目标的不同,Rasch模型功能和指标的选择以及结果的解释都存在相当大的差异,研究者需要基于测量目标进行选择,根据实际情况灵活处理。  相似文献   

12.
基于项目反应理论(IRT)的视角对某中学八年级数学期末考试的学业成绩应用S-P表和Rasch模型分析软件WINSTEPS进行比较分析,其结果显示二者既有同一性也有差异性。整体情况分析时均显示试题总体质量较好,能为多数学生提供准确成绩分析,但Rasch模型分析结果在学生能力水平估计、极端数据分析上相比S-P表更加准确。个别试题存在群组间的测量偏差,需要改进。为实现优化教学的目的,教师需综合使用两种分析工具。  相似文献   

13.
本研究的目的是描述一个用于测量写作能力的多面Rasch(FACETS)模型。该FACETS模型是Rasch测量模型的多元变量拓展,它可为写作测评中的校标评分员和写作题目提供框架。本文展示了如何应用FACETS模型解决大型写作测评中遇到的测量问题。参加全州写作考试的1000个随机抽取的学生样本被用来显示该FACETS模型。数据表明即使经过强化训练,评分员的严格度有显著区别。同时,本研究还发现,写作题目难度的区分,虽然微小,却具有统计意义上的显著性。该FACETS模型为解决以作文测评写作能力的大型考试遇到的测量问题提供了一个有前景的途径。  相似文献   

14.
RCMLM模型是基于Rasch测量理论的通用拓展模型。利用RCMLM模型对一份普通高中数学试卷进行不同性别的DIF分析。结果表明:该模型可对具有二分计分和多分计分的试题同时进行DIF分析,避免了以往分别对两种计分方式试题进行DIF分析的弊端,保持了试卷的完整性,使DIF分析结果更加有效。  相似文献   

15.
Rasch模型具有被试参数和项目参数相互独立的性质,即被试能力与项目难度无关。本研究以某年度大学入学考试数学学科的实测成绩数据为例,在随机抽样、不同性别抽样、不同水平群体抽样等条件下,对Rasch模型项目参数不变性进行了验证研究。研究表明:Rasch模型项目参数不变性验证的前提条件较为严格,需要排除诸多干扰因素的影响;Rasch模型项目参数不变性的验证存在一定的误差,无法实现与理论一致的"不变性";Rasch模型项目参数不变性没有统一的标准,需依据实际问题确定。  相似文献   

16.
运用Rasch模型对2016年福建省综合质检文科英语测试数据进行分析。研究结果表明:实测数据与Rasch模型拟合较好,2016年福建省综合质检文科英语试卷是一套高质量的测验,能够较好区分考生的能力水平;但是,该测验中有个别题目的作答反应与Rasch模型的拟合效果不太理想,测验题目的难度分布也有一定的优化空间,这两点值得命题团队反思和总结,可以服务于教学调整并为下个周期的命题提供有益的测量学参考。  相似文献   

17.
界定了"模型认知"能力其及水平层次,应用Rasch模型开发和优化了测量工具.根据大样本测试数据对中学生"模型认知"能力现状进行了分析.结果显示,中学生的"模型认知"能力平均水平较弱,高一学生与高二学生之间无显著性差异,但皆与高三学生之间存在显著性差异,男生的水平显著高于女生.  相似文献   

18.
Rasch模型和IRT在学生成就测验统计分析中的对比研究   总被引:1,自引:0,他引:1  
Rasch模型和项目反应理论的诞生推进了社会科学领域研究方法的变革。大多数学者认为,Rasch模型就是三参数IRT模型的特例。其实,Rasch模型不同于项目反应理论,其数据必须符合模型的先验理论。研究利用基于这两种理论假设开发的软件Winsteps和Multilog对学生成就测验进行统计分析,旨在揭示两种理论模型数据分析结果的异同之处,并探讨Winsteps软件在教育统计中的应用。  相似文献   

19.
计算机自适应测验中Rasch模型稳健性的模拟研究   总被引:1,自引:0,他引:1  
本研究采用模拟数据的方法,在计算机自适应测验(Computer Adaptive Test,简称CAT)中分别采用Rasch及Birnbaum两种模型估计能力,通过比较两者的误差均方根(Root Mean Square Error,简称RMSE)、平均差异(Average Deviation,简称AD)及能力相关,对Rasch模型在CAT中的稳健性进行了研究。结果发现Rasch模型在区分度不等的条件下仍然能较准确地估计被试的能力水平,具有很强的稳健性。  相似文献   

20.
PISA作为三年一轮针对15岁学生群体的国际评价项目已为中国教育界熟悉,其工具构造和数据分析体现了目前国际上教育测量理论和技术的最高水平。本文从教育测量专业角度归纳了PISA通过试卷矩阵设计保证考查内容覆盖广泛、利用Rasch模型打造客观等距量尺、结合考生背景解释和分析测试结果等主要技术特征,并类比分析了我国高考在相应环节的技术缺陷,展望了将这些技术移植到高考中,以达到创新考试形式,防范高考结果被滥用和误用的可能。在某省高考中试点后的结果表明,上述技术的应用使高考不只用于选拔分流,还能对评价教育质量、改进教育管理、促进教学改革发挥重要的作用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号