首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
四 教育测验分数的转换 标准参考性测验不存在分数调整问题。这里主要介绍一下常模参考性测验分数调整的方法,即建立常模或量表。常模参考性测验通常采用百分位等级或标准分及其有关的分数量表解释及报告分数。 百分位等级是根据每个考生的原始分数在考生总体中所占的百分位给出的一种分数量表。例如,某一考生在考试中所得分数为85分,低于或等于85分的考生数在考生总体中所占的比例为70%,那么,这个考生的百分位等级分数为70。在百分位等级分数量表中,由于考生在各分数段上分布的比例相同,因此,它的分数分布是一条水平直线。如下图所示:  相似文献   

2.
本研究通过随机选取2382名考生,采用共同组等值设计和线性等值法,对MHK三级与HSK三级、四级、五级、六级的考生成绩进行了等值,等值结果包括听力、阅读、书面表达各分测验分数及测验总分。  相似文献   

3.
测验等值的单组设计,是将需等值的测验X、Y都由同一考生组施测,然后对测验分数进行等值。其优点是考生组只有一个X、Y成绩的差异将归因于测验的不同而不会混杂考生组不同的因素。缺点是同一考生要测验两次,练习效应和疲劳将会干扰等值结果。本文提出一种新的设计方法──单组设计试卷分半法,是在单组设计中,把测验X、Y各分成平行的两半卷,各取X、Y的半卷组成新的测验Z,将Z对同一考生组施测,根据施测结果导出等值转换公式进行分数等值转换。这种方法每个考生只施测一次,既保持了单组设计的优点,又克服了它的缺点。  相似文献   

4.
曹文娟  白俊梅 《考试研究》2013,(3):79-85,33
本文使用R-2.15.2软件模拟研究锚测验难度参数方差特征对测验等值误差的影响,采用三种等值方法(链百分位等值法、Levine等值法和Tucker等值法)对锚测验不同类型的难度方差进行比较研究。结果显示,当锚测验难度方差小于全测验难度方差时,其等值的随机误差和系统误差与锚测验难度方差和全测验难度方差一致时(即锚测验为全测验的平行缩减版minitest时)的表现基本相同。因此,对锚测验而言,要求其与全测验具有相同的统计规格可能过于严格。  相似文献   

5.
本文详细阐述了网上能力测验系统的设计思想和采用的技术。该系统从功能的集中化要求出发,集智力测试、常模制作、形成等值测验、辅助测验设计与修订等功能于一身。其中,系统的辅助测验设计与修订功能以及常模制作功能,又为当前能力测验中普遍存在的单一、缺乏等问题提供了解决的方法。在实际的模拟开发基础上,又提出在智力测试计算机化的特定环境下暗示语、特殊标记等使用的必要性。同时也对网上能力测验可能产生的问题谈一点初步的设想。  相似文献   

6.
本文详细阐述了网上能力测验系统的设计思想和采用的技术.该系统从功能的集中化要求出发,集智力测试、常模制作、形成等值测验、辅助测验设计与修订等功能于一身.其中,系统的辅助测验设计与修订功能以及常模制作功能,又为当前能力测验中普遍存在的单一、缺乏等问题提供了解决的方法.在实际的模拟开发基础上,又提出在智力测试计算机化的特定环境下暗示语、特殊标记等使用的必要性.同时也对网上能力测验可能产生的问题谈一点初步的设想.  相似文献   

7.
陈军  王峰 《教育信息化》2004,(12):37-39
本文详细阐述了网上能力测验系统的设计思想和采用的技术。该系统从功能的集中化要求出发,集智力测试、常模制作、形成等值测验、辅助测验设计与修订等功能于一身。其中,系统的辅助测验设计与修订功能以及常模制作功能.又为当前能力测验中普遍存在的单一、缺乏等问题提供了解决的方法。在实际的模拟开发基础上,又提出在智力测试计算机化的特定环境下暗示语、特殊标记等使用的必要性。同时也对网上能力测验可能产生的问题谈一点初步的设想。  相似文献   

8.
采用内蒙古师范大学连续四年入学新生22108名的SCL—90症状自评量表的数据,建立内蒙古师范大学SCL—90新生常模,并与已有的常模比较。结果表明:内蒙古师范大学新生的SCL—90总体常模与全国常模不一致;显著低于全国常模、全国大学生常模和全国青年组常模;另外,内蒙古师范大学新生的SCL—90的测查结果显示,需建立性别常模,且在多个因子的得分上女生显著高于男生。该研究结果可以作为内蒙古师范大学新生入学心理健康的参考标准,与全国常模比较,更加准确可靠。  相似文献   

9.
目的:探讨有精神病性症状的躁狂发作患者父母的心理健康状况及人格特征.方法:使用90项症状清单(SCL-90)和明尼苏达多相个性调查问卷(MMPI)评定有精神病性症状躁狂发作患者的父母46例,并将评定结果与中国常模比较.结果:1.患者父母SCL-90的总分、总均分、阳性项目数、阳性均分、人际关系敏感、焦虑、敌对、偏执因子分与常模比较有高度显著性差异或显著性差异(P<0.01或P<0.05),低于常模;患者父母的强迫症状因子分显著高于常模(P<0.05).2.在MMPI测验中,父亲组的轻躁狂(Ma)、诈病(F)、癔病(Hy)量表分显著高于常模,而抑郁(D)、社会内向(Si)量表分则显著低于常模(P<0.05);母亲组轻躁狂(Ma)、癔病(Hy)量表分显著高于常模(P<0.05).结论:1.双相障碍患者父母的强迫症状评分偏高可能反映了患者父母的固有素质特征;2.双相障碍患者的父母存在与躁狂发作患者的临床表现方向一致的个性特征,但在程度上存在着明显的差异.  相似文献   

10.
共同被试法是通过相同被试寻找不同测验形式之间等值关系的方法,适用于大规模测验的等值转换。当两个实际被试组能力分布差异较大或能力分布未知的情况下,可采用同一组被试,让他们参加两种测验形式的测验。然后通过比较这一组被试在两种测验上的分数,得出测验等值关系。  相似文献   

11.
适用于孤独症及相关发育障碍的心理教育量表(简称PEP量表)在中国大陆的修订和发展历时近20年,PEP量表跨文化中文修订的前期研究重点主要在于测验工具的标准化及测验性能的初步验证,注重在临床实践中应用评估结果来制定个别化的教育计划。本研究在此基础上进一步延伸PEP中文版的跨文化修订,编制中文版心理教育量表(C-PEP)的中国城市常模;验证这一中国城市常模的有效性;对比中美两国发展常模的差异并分析其原因;对C-PEP量表在未来研究和教育应用进行展望。  相似文献   

12.
本研究基于IRT理论中最常用的LOGISTIC三种模型来探讨等值的跨样本一致性,研究对象为某一汉语类别的测验,等值方法采用同时校准法。研究结果表明,双参数模型下同时校准法等值跨样本一致性最好,最为稳定。  相似文献   

13.
《韦氏儿童智力量表-第四版》于2003年在北美公开发行和使用以来,得到众多学校心理学、儿童心理学和临床心理学专家的好评。与以往韦氏儿童智力量表相比,第四版本不再使用单一的言语量表得分和操作量表得分来笼统概括儿童的智力水平,而是提供了言语理解(Verbal Comprehension)、知觉推理(Perceptual Reasoning)、工作记忆(Working Memory)和加工速度(Processing Speed)四大分量表的索引得分以及一个全量表得分。这种更加细化的分类使得这一测验的结果有助于更精确地做临床诊断。心理学工作者和特殊教育工作者可以更直观、更具体地判断出被试是否在某一特定的认知功能方面有障碍或缺陷。韦氏第四套智力量表与以往的韦氏量表相比不仅仅是更新和扩大了常模,其设计理念的改进、记分方法的改变都使得该测验的结果更有助于心理学和特殊教育工作者做出更准确的解释和临床判断。文章详细介绍了韦氏第四套儿童智力量表的结构、相关的理论支持、各个分测验的设计理念和作用、信度和效度等指标、如何解释该量表的测验结果以及其临床应用价值等。笔者希望该简介有抛砖引玉的作用,使同行可以以“他山之石”为用。  相似文献   

14.
1前言 测验等值是对考核同一心理品质的多个测验形式系统地做出测验分数转换.从而使不同测验形式的测验分数之间具有可比性。由于项目反应理论(IRT)将项目难度与心理特质(能力)定义在同一量表上,故也可以认为IRT中的等值是将考核同一心理品质的多个测验形式系统地做出项目参数转换.从而使不同测验形式中的项目参数之间具有可比性。  相似文献   

15.
考试分数主要有常模参照和标准参照两种表达方式,美国新版高考SAT-I成绩报告单中的6种常模参照分数和3种标准参照分数对此提供了具体案例.在设计和使用分数时,需要警惕来自测评信度、效度、公平性、原始分使用、标准分或等级分的设计与使用条件、常模与等值的结合,以及量表"漂移"等7个方面的潜在风险.规避这些风险的办法主要有加大科普力度、设立行业标准、成立考试政策与技术咨询委员会、发掘考试大数据的价值、促进考试工作的专业化发展等.  相似文献   

16.
目的:以经典测量理论为基础,采用半投射式测验形式,编制小学生学习动机测验,为小学生学习动机的测评提供测量工具。方法:采用整群抽样法,在湖南省长沙市和河南省郑州市4所小学抽取有效样本759份,其中男女生分别为409人和350人,二、四和六年级样本数分别为175、299和285。结果:本测验由两个分测验、6个因素和25个项目组成。25个陈述项目中,有18个为自编,自编率达到72%;图片均为自编,自编率为100%。项目分析结果表明,所有项目与所属分测验的相关为0.57~0.73,所有项目高低分组差异显著,均达到优秀。信度分析结果表明,测验各维度的克伦巴赫α系数为0.50~0.62。效度分析中,探索性因素分析表明,测验的因素负荷为0.49~0.78,累积贡献率为47%和44%;验证性因素分析的CFI和TLI拟合指数均高于0.92,x^2/df低于1.34,RMSEA小于0.04;成就动机分测验与MAAT中成就动机的相关为0.34~0.35,目标定向分测验与《四分成就目标定向量表》的相关为0.21~0.73,测验与学习兴趣量表的相关也符合测量学要求。结论:小学生半投射式学习动机测验符合心理测量学的基本要求并具有自主知识产权。  相似文献   

17.
测验等值     
测量等值是将不同标尺的测验分数转换到同一标尺的测量技术.具体地说,测验等值是将测量同一性质的知识或心理品质的多个测验形式的测验分数转换成相同标尺的分数,进而使得这些不同测验形式的分数之间具有可比性.例如,有A、B、C三种测验,都是测量英语水平的.如果同一个学生在这三种测验上发挥状态相同,A测验得60分,B测验得65分,C测验得55分,说明C测验最难,A测验次之,B测验最容易.这三种测验分数要等值,都可以转换到某一测验的分数系统.若转换到A测验分数系统,那么B测验的65分,C测验的55分,都对应于A测验的60分.  相似文献   

18.
测查同一心理特质的两个或多个测验的分数单位系统经过转换,从而使这些测验上的分数能够对应起来,就叫做测验等值或测验分数等值。这就好比度量温度的摄氏温度计与华氏温度计上的度数,经过单位系统的转换,从而可以实现互化一样。测验等值在测验实施,编制与结果分析,题库的建立,不同单位、地区、时间上的学科成绩的比较等方面,都是极为必要的。比如我们的高考,一般都有备用卷。当普通采用的正  相似文献   

19.
由于测验安全性、试卷组卷不当等问题,有些测验的题本相互之间不能或者没有设置锚题。对作答不同题本的被试进行分数比较时,需要用到测验等值技术。不同于有锚题测验能通过题本之间的锚题进行等值,无锚题情境下的测验需要借助于一些特殊方法进行等值。目前,对无锚题测验进行等值主要有三种方式,一种是通过测验中具体的题目,也就是构建相同的"锚题"来进行等值,如构造随机等组测验法和利用题目先验信息进行等值的方法;一种是通过构建相同被试组来进行等值,即构造随机等组样本法;还有一种是借助于测验题目所考查的认知属性来进行等值,一般是基于一种认知诊断模型——规则空间模型来进行操作。  相似文献   

20.
测验等值使得不同形式的考试能进行比较,从而保证了测验之间的相对稳定性。基于IRT的分数等值是在估计出参数的基础上进行的参数转换,等值结果的稳定性与考生样本量密不可分。本研究针对汉语水平考试(HSK)阅读分测验,采用真实数据模拟共同组锚测验设计,确定等值的参照标准,考察考生样本量的变化对IRT分数等值稳定性的影响。结果表明,考生样本量为2000左右时各种方案的等值结果均比较稳定。考生样本量进一步增大时,等值误差不降反增。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号