首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
测验的常模   总被引:1,自引:0,他引:1  
在教育测量学中,我们要想正确地解释、评价和使用测验的分数,必须借助于某项参照标准。常模就是这样一种参照标准。  相似文献   

2.
随着国内外教育测量理念的转变,传统的常模参照测验所提供的相对性评价信息已无法满足考试用户和考生的需求,标准参照测验(CriterionReferenced Test,CRT)的社会价值越来越受到重视。在对被试掌握程度进行分类决策的CRT测验中,如何确定恰当的测验长度和合格分数是影响测验分类误差的重要因素。本文在对CRT测验研究的现状、原理和用途进行考察的基础上,专门介绍了二项式概率模型在CRT测验长度决策研究中的理论和过程,并以误差控制为原则,对二项式模型在综合性标准参照语言测验长度和合格分数决策中的应用过程进行了研究。  相似文献   

3.
本文通过标准参照测验的研究,以编制标准参照测验的理论为依据,以项目反应理论指导,结合操作系统的考试科目给出了标准参照测验的编制过程。  相似文献   

4.
本文在测验长度理论的基础上,对国外学者在标准参照测验长度研究中常用的二项式模型、不肯定区域模型和项目反应理论模型的理论基础、适用条件以及操作思路进行了探讨,以期对国内标准参照测验长度的研究提供参考与借鉴。  相似文献   

5.
标准参照测验在国外很受推崇,这种测验已成为评价学校教学和学生学习情况的重要手段,从平时教学的单元测试到不同水平的毕业考试,几乎无不属于标准参照测验。一、标准参照测验的产生自从第一次世界大战以后,标准化测验得到了广泛地应用,但所有的测验几乎都是常模参照的,在这种测验中,一个人的分数是通过与其他人的比较来进行解释的,并可  相似文献   

6.
本文从国内外一些重大的标准参照测验的分数体系出发,探讨其共同点和不同点,为以后的标准参照测验分数体系提供参考。  相似文献   

7.
对托福、托业、雅思、大学英语考试、新汉语水平考试等大规模第二语言测试的分数解释体系进行比较研究,提出单标准参照与多标准参照、精度标准参照与跨度标准参照等概念。大规模的第二语言测试应当同时提供标准参照和常模参照,使考试用户获得更为丰富的分数解释信息;对于标准参照而言,"单标准参照"的"完成能力标准的百分比"这一分数解释体系更为可取。  相似文献   

8.
考试分数主要有常模参照和标准参照两种表达方式,美国新版高考SAT-I成绩报告单中的6种常模参照分数和3种标准参照分数对此提供了具体案例.在设计和使用分数时,需要警惕来自测评信度、效度、公平性、原始分使用、标准分或等级分的设计与使用条件、常模与等值的结合,以及量表"漂移"等7个方面的潜在风险.规避这些风险的办法主要有加大科普力度、设立行业标准、成立考试政策与技术咨询委员会、发掘考试大数据的价值、促进考试工作的专业化发展等.  相似文献   

9.
标准参照评价中提出的新任务   总被引:1,自引:0,他引:1  
传统的教育评价,主要是常模参照性评价,把学生和其他人比,关注的问题是“在一组人中他处于什么位置”,致力于对考生进行排队。今天,越来越多的人开始关注标准参照性评价。标准参照评价所关注的问题是“学生能做什么(can do)”?学生具有哪些知识和技能?学生能够完成哪些任务?因此,标准参照评价也被称为“基于任务(task based)”的评价。  相似文献   

10.
赵世明 《中国考试》2006,(10):30-34
分类一致性是标准参照测验信度研究的重要内容,而在国内的各种资格认证测验和水平考试中却鲜见应用和报告。本文尝试利用分半方法估计分类一致性信度指标。结果表明,在分类一致性信度指标的关键特征上,分半法估计结果与两次施测或同质复本方法的结果是一致的。此种方法对于大规模资格认证羽验来说是可行的,即容易解释和理解,更便于实际操作。  相似文献   

11.
贯穿测验过程的公平分析思路   总被引:1,自引:1,他引:0  
作为有效甄选或鉴别人才的重要手段,测验对于倡导公平公正的社会理念,确保个体的机会公平、起点公平和过程公平具有独到的作用。本文参照《教育与心理测验标准》、《ETS质量与公平性标准》、《教育测验实务公平性准则》以及国内专家关于测验公平性的论述,从测验编制和使用的四个环节探讨贯穿测验过程的公平分析思路。  相似文献   

12.
1985年《教育与心理测验标准》(第5版)出版之前,效度研究的核心概念是"效标(criterion)",效度研究被视为一种用"效标"对测验的效度进行证明(verify)、对测验分数做出有效(valid)解释的过程。1985年以后,效度研究的核心概念是"证据(evidence)",效度研究被视为一种通过积累证据对测验的效度进行支持(support)、对测验分数做出合理(reasonable)解释的过程。关于效度的这种理解,突出体现在1999年出版的《教育与心理测验标准》(第6版)中。美国教育协会和美国国家教育测量学会共同组织编写的《教育测量》在业内被称为"教育测量领域的《圣经》"。2006年《教育测量》(第4版)出版以后,效度研究的核心概念演变为"理由(warrant)",效度研究被视为一种通过构造"理由系统"和"理由网络"对效度进行"论证(argument)"、对测验分数做出可接受的(plausible)解释的过程。本文结合笔者的考试实践,介绍了效度概念的新发展。  相似文献   

13.
成就测验用以测量经过一段时间学习和训练后取得的成就。教师自编测验是成就测验的一个分支,在我国的基础教育中扮演着重要的角色。其测验结果——考试成绩为评价学生的学习效果和学校教育质量提供了一个客观的指标。但对考试成绩的片面认识和过分追求会给学生的发展带来很多消极影响。基于此,通过剖析成就测验的理论知识,帮助教师、家长和学生形成正确的成绩观很有必要。同时,在剖析的基础上对看待考试成绩及根据它提高教育质量、培养学生能力提出了个人的见解。  相似文献   

14.
自本世纪六十年代开始,目标参照测验越来越受到人们的重视,然而,至今目标参照测验的测量学指标体系尚未建立起来,在对目标参照测验进行设计或者对考试结果进行分析时,仅仅是搬用常模参照测验的统计指标,显然,这是不利于考试科学化的。事实上,两种测验的目的、性质、功用都不相同,其指标体系及每个指标的含义和估计方法也是不应相同的。  相似文献   

15.
汪英 《中国考试》2004,(2):26-36
根据分数解释的不同,考试分为常模参照考试和标准参照考试。  相似文献   

16.
高考分数的解释通常基于常模参照,尚少进行标准参照解释。本文以2014年高考(天津卷)数学(文史类)试卷为例,探索高考分数的标准参照解释,阐述基于考生水平表现标准的评价结果对于改进教与学的效用,提出大处着眼、小处着手、普遍联系、有的放矢等教学建议。  相似文献   

17.
张军 《考试研究》2013,(4):68-75
对外汉语课程测验属于标准参照性测验,应使用标准参照性测验理论体系下的技术指标对测验进行项目分析和评价,传统的分析方法(如区分度)不完全适用于课程测验的项目分析。本文使用该理论对北京语言大学汉语进修学院某次考试试卷进行分析,希冀为对外汉语教学提供一些有益的经验。实验结果表明:对“掌握者”和“未掌握者”来说,题目难度总体上可接受,大部分题目的区分性能良好,虽然有的题目略有“瑕疵”,但值得保留,以提高教学内容的测试覆盖面及测验信度。有7个题目过难或过易,几乎不具备区分性能,需要删除或修改。  相似文献   

18.
引言近年来,随着考试科学的不断发展和高考标准化的推广与实施,常模参照测验理论已被大多数考试工作者所熟悉。但是对标准参照测验理论与技术却显得非常薄弱,特别是在目前,校内考试、自学考试、高中毕业会考、各种证书考试蓬勃发展的时  相似文献   

19.
考试词典     
常模参照测验(norm-referenced test)《心理学大词典》(朱智贤主编)中定义为:把常模作为解释个人测验分数的参照标准的一种测验。此测验以区分受试者的个体差异为目的,要求将他们的差别在量表上反映出来。《教育大词典》(顾明远主编,第七卷)中定义为:以  相似文献   

20.
本文从标准参照考试与常模参照考试的比较中,指出了标准参照考试的特点,以及标准参照考试的题目编制和题目分析方法,并对标准参照考试的应用提出了若干建议。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号