首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
随着国内外教育测量理念的转变,传统的常模参照测验所提供的相对性评价信息已无法满足考试用户和考生的需求,标准参照测验(CriterionReferenced Test,CRT)的社会价值越来越受到重视。在对被试掌握程度进行分类决策的CRT测验中,如何确定恰当的测验长度和合格分数是影响测验分类误差的重要因素。本文在对CRT测验研究的现状、原理和用途进行考察的基础上,专门介绍了二项式概率模型在CRT测验长度决策研究中的理论和过程,并以误差控制为原则,对二项式模型在综合性标准参照语言测验长度和合格分数决策中的应用过程进行了研究。  相似文献   

2.
本文通过标准参照测验的研究,以编制标准参照测验的理论为依据,以项目反应理论指导,结合操作系统的考试科目给出了标准参照测验的编制过程。  相似文献   

3.
罗莲 《中国考试》2007,(6):18-22
本文据美国教育研究协会等机构编写的《教育与心理测试标准》,探讨了“常模参照”和“标准参照”两术语的内涵、使用及其关系。该《测试标准》认为,从同一个测验得到的分数,可做出常模参照和标准参照两种解释。两者是从分数解释的意义上划分的,并非两种不同的测验。因此,以前将测验割裂为“常模参照测验”和“标准参照测验”的二元划分是不恰当的。  相似文献   

4.
目的:尝试在项目反应理论的指导下,编制四年级数学成就测验,为学科评价提供辅助工具.方法:用贝佳访法检验试测数据的单维性,利用ANOTE软件估计项目参数,用基于题目分类下的经验判断法建立一个划界分数,再接合项目信息量和双向细目表编制成卷.结果:四套试卷均符合单维性要求,基本拟合三参数逻辑斯蒂克模型,项目拟合度都在85%左右,最终选取141个信息量高的项目组成正式题库,精选50个项目组成四年级数学标准参照测验.  相似文献   

5.
基于项目反应理论的测验编制方法研究   总被引:3,自引:0,他引:3  
本文在简单介绍项目反应理论的基础上,从计量分析的角度,深入探讨了应用项目反应理论编制各种测验的一般步骤;探讨了项目反应理论题库建设方法及基于题库的测验编制方法;探讨了标准参照测验合格分数线的划分方法。  相似文献   

6.
贯穿测验过程的公平分析思路   总被引:1,自引:1,他引:0  
作为有效甄选或鉴别人才的重要手段,测验对于倡导公平公正的社会理念,确保个体的机会公平、起点公平和过程公平具有独到的作用。本文参照《教育与心理测验标准》、《ETS质量与公平性标准》、《教育测验实务公平性准则》以及国内专家关于测验公平性的论述,从测验编制和使用的四个环节探讨贯穿测验过程的公平分析思路。  相似文献   

7.
信度与效度是衡量心理测验质量的重要指标。增加测验长度是提高测验信度和效度的重要方法之一。由于各学者对效度的代表符号规定不一,导致对于说明测验长度与测验效度关系的公式及其计算结果难于理解和解释。根据经典测量理论对代表测验长度与测验效度关系的公式进行分析和讨论,提出测验效度与长度关系的表达公式。  相似文献   

8.
情境化测验需要建构真实性情境任务,以便有效测量教育评价改革背景下学生的核心素养。梳理情境化测验的研究进展发现:问题情境创设和测验表现形式设计是其开发的重点;对于情境化测验中复杂数据的评分方法,主要有理论驱动、数据驱动及两者相结合3种方式;传统心理测量及其拓展模型和基于随机过程的测量模型是情境化测验的常用模型。情境化测验的流行是教育测验领域的进步,但进一步的发展还需要规范测验的开发标准、提升测验的信效度、探索复杂情境的建模方法及提升复杂数据的教育意义阐释。  相似文献   

9.
余娜  辛涛 《中国考试》2007,(9):14-19
规则空间模型是一种基于统计模式识别和分类的认知诊断模型,能够提供关于考生作答模式与属性掌握情况的详细信息。在理论上,该模型解决了成就测验中测验单维性与项目单维性的问题,并发展出ACC曲线对项目反应理论进行了拓展;在实践中,规则空间模型可以用于指导测验项目的编制,为诊断教学提供信息,还能广泛应用于成就测验以外的心理与教育测量的各个领域。[编者按]  相似文献   

10.
测验的常模   总被引:1,自引:0,他引:1  
在教育测量学中,我们要想正确地解释、评价和使用测验的分数,必须借助于某项参照标准。常模就是这样一种参照标准。  相似文献   

11.
Rasch模型和IRT在学生成就测验统计分析中的对比研究   总被引:1,自引:0,他引:1  
Rasch模型和项目反应理论的诞生推进了社会科学领域研究方法的变革。大多数学者认为,Rasch模型就是三参数IRT模型的特例。其实,Rasch模型不同于项目反应理论,其数据必须符合模型的先验理论。研究利用基于这两种理论假设开发的软件Winsteps和Multilog对学生成就测验进行统计分析,旨在揭示两种理论模型数据分析结果的异同之处,并探讨Winsteps软件在教育统计中的应用。  相似文献   

12.
“确定问题测验”是科尔伯格的学生吉姆·莱斯特于1974年开发,最初作为测量科尔伯格提出的道德发展理论的简便的测验,该测验很快成为对道德认知理论进行修改的重要基础。近30年来,确定问题测验取得了很多新进展,从最初依据科尔伯格的道德理论制定DIT量表,到随后对其指标的验证;从围绕DIT研究其背后的道德机制,到随后多方位的“四成分模型”的提出,以及到最近由于受到哲学、应用伦理学、发展心理学特别是范式理论的影响,开始用新科尔伯格理论来重新审视DIT;最后从对道德的理论研究向应用方向发展,特别是教育领域的渗透推进了DIT测验的完善,加深了人们对于道德问题的认识。  相似文献   

13.
本文从国内外一些重大的标准参照测验的分数体系出发,探讨其共同点和不同点,为以后的标准参照测验分数体系提供参考。  相似文献   

14.
基于计算机的测验已逐渐普及,但不同的计算机测验形式在测量相同任务时可能会产生测验结果的偏差,从而导致教育测量与评价结果的不公平性。文章基于项目反应理论,探讨了计算机化线性测验与计算机自适应测验在测验效率、测验结果的统计学特征及其对考生个体心理特质的影响是否等效等问题,并以师范生"现代教育技术"课程为例开展了实证研究,结果显示:两种测验中考生的分数具有可比性,计算机自适应测验具有更高的测验效率与测验信度,但有无即时反馈对考生测验焦虑的影响较大;而计算机化线性测验具有更合理的内容效度,有无即时反馈对考生测验焦虑的影响较小。文章的研究不仅对教学评价中测验形式的选择是否公平合理进行了科学分析,而且为施测者根据测验场景有针对性地选择测验形式提供了理论参考。  相似文献   

15.
系统介绍目前国内外传统的人格测量方法—客观量表类测验、投射法、作业法,以及非传统测验方法。并列举各种测验方法中常用的几种人格量表,并且介绍它们的理论假设、优缺点及其在现阶段的研究情况等,对于了解和使用人格测验进行测量和研究提供了一些理论参考及对照。  相似文献   

16.
阅读理解能力测验中所选择的文章在内容方面对不同专业背景的考生亚团体是否具有公平性的问题,是测验效度高低的重要证据,也是测验效度验证(validation)的重要环节。本研究以中国语言与文学专业考生为目标组,分别将经济学专业和生物医学专业考生作为参照组,采用效标测量和蕴涵量表分析相结合的方法,对HSK(高等)阅读理解测验的文章难度对三个不同专业背景的考生组的公平性问题进行了检验。研究结果表明,两个参照组考生尽管具有各自的相对专业优势,但他们在六篇阅读材料上获得的难度排列顺序与目标组考生完全一致;虽然目标组考生不具备汉语知识以外的其他专业优势,但因为HSK考试所选择的阅读材料没有涉及语言知识本身以外的特殊专业要求,因而测验对三个不同专业背景的考生具有较高的公平性。  相似文献   

17.
BP神经网络是目前应用最广泛的人工神经网络模型之一,在分类和识别上表现出良好的特性,因此被研究者用于认知诊断评估以对被试进行诊断分类。通过模拟研究,考查属性个数、属性层级关系、测验长度、题目质量、测试样本量5个因素对BP神经网络在认知诊断中分类准确性的影响。结果表明:1)基于BP神经网络的认知诊断分类准确率不依赖于测试样本量;2)题目质量和测验长度对BP神经网络的诊断准确率有显著的积极影响;3)属性个数对BP神经网络的分类准确率有消极影响;4)题目质量一定程度上会影响BP诊断方法在不同属性层级结构上的分类准确率。  相似文献   

18.
认知诊断测验的优劣直接影响诊断的效果及质量。与传统测验相比,认知诊断测验在测验目的和功能、测验编制的理论基础以及测验项目质量的评价标准方面均存在不同。本文梳理了目前国内外几种认知诊断测验编制的相关理论及方法,并提出了认知诊断测验编制的基本过程,即确定诊断目标→构建认知模型→认知诊断测验项目设计→项目编写→项目测量学参数获取→测验组卷,为认知诊断测验的编制研究者及实际编制者提供一定的参考和指导。  相似文献   

19.
Angoff方法有效性的检验研究   总被引:2,自引:0,他引:2  
Angoff方法是标准参照测验中确定分数线的常用方法,本研究提出了质量系数、校正的Angoff分数线等概念和计算方法,对Angoff方法有效性的检验进行了研究,考察了评判者的个人特性和质量系数的相关,研究验证了Angoff方法得到的分数线是有效的。  相似文献   

20.
内隐态度研究综述   总被引:1,自引:0,他引:1  
内隐态度是个体无法内省识别到的态度,多采用内隐联想测验等间接方法测量。双重态度模型理论认为,人们对同一态度对象同时存在外显态度和内隐态度。而后在不同领域研究结果也证明了内隐态度的存在,并且内隐和外显态度是分离的。但在内隐和外显态度比较研究和设计内隐联想测验等方面仍存在一些不足。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号