期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《中国考试》2004,(4)

复本信度又名"等值性系数"、"替换本信度"。指用两份具有同等价值的测验在最短的时距内对同一组被试施测所得两次成绩之间的相关系数。反映两个测验的一致性和试题取样的代表性。复本信度要求两个测验必须真正等值。复本信度的差异主要来源于复本之间的等值性。为了消除施测顺序效应,在实际应用时,可以让被试中的一半人先做测验A再做测验B,另一半人先做测验B再做测验A。相似文献

2.

测验等值的方法：共同被试法

一帆《教育测量与评价(理论版)》2015,(6)

共同被试法是通过相同被试寻找不同测验形式之间等值关系的方法,适用于大规模测验的等值转换。当两个实际被试组能力分布差异较大或能力分布未知的情况下,可采用同一组被试,让他们参加两种测验形式的测验。然后通过比较这一组被试在两种测验上的分数,得出测验等值关系。相似文献

3.

教育考试中怎样编制A、B卷

柳恒超《中国考试》2005,(4):30-32

在心理与教育研究中经常需要对同一测量编制A、B卷．例如。在教育实践中为了应付紧急情况或防止考生作弊等需要对同一测量编制A、B两种型式．在重要考试中。如高考，每门学科的考卷都要编制A、B卷。以防不测。在心理或教育研究中，为了计算测验的复本信度，毫无疑问也需要A、B两种型式；除了确定测验的信度外。出于其他原因也需要问卷的A、B两种型式。例如，在追踪研究或研究某种实验干预因素对测验成绩的影响方面．复本也十分有用。使用复本还可以减少辅导或欺骗的可能性。相似文献

4.

汉语水平考试(HSK)复本测验稳定程度的历时性研究

柴省三《现代语文》2011,(2)

在大规模、标准化语言测验中,如何确保复本测验分数之间具有等价性和稳定性的问题,是测验分数信度高低的重要标志之一,也是测验结果解释和分数使用效度高低的重要证据之一.本文在对汉语水平考试(HSK)标准化开发程序和等值处理技术进行考察的基础上,重点对国内最近两年HSK考试使用的8份复本测验分数之间的稳定进行了统计分析.结果表明,HSK测验的复本分数之间具有较高横向稳定性,所有测验试卷的分数与标准卷均具有历时一致性. 相似文献

5.

α系数受考生能力分布范围影响的研究

余嘉元《上海教育科研》1990,(4)

一在经典测量理论中,人们已经认识到,测验结果的信度会受到考生分数分布范围的影响。考生分数的分布范围越大,信度系数也越大。但人们在阐述这个问题时,一般都是以相关系数为例来说明的,因为相关系数会受到变量取值范围的影响,而有些信度系数也正是用相关系数来表示的,例如:重测信度、复本信度和分半信度,因此,认为这些信度系数将受到分数分布范围的影响,这显然是合理的。但是,目前我国的许多教育测量工作者,还经常采用α系数表示测验结果的信度,α系数是一相似文献

6.

测验等值

一帆《教育测量与评价(理论版)》2015,(3):54

测量等值是将不同标尺的测验分数转换到同一标尺的测量技术.具体地说,测验等值是将测量同一性质的知识或心理品质的多个测验形式的测验分数转换成相同标尺的分数,进而使得这些不同测验形式的分数之间具有可比性.例如,有A、B、C三种测验,都是测量英语水平的.如果同一个学生在这三种测验上发挥状态相同,A测验得60分,B测验得65分,C测验得55分,说明C测验最难,A测验次之,B测验最容易.这三种测验分数要等值,都可以转换到某一测验的分数系统.若转换到A测验分数系统,那么B测验的65分,C测验的55分,都对应于A测验的60分. 相似文献

7.

测验信度大盘点 总被引：1，自引：0，他引：1

竺培梁《外国中小学教育》2005,(6):18-25

信度是对测量一致性程度的估计。信度分成再测信度、复本信度、同质信度、评分者信度等四种类型。测验的长度与难度以及被试团体的变异性与能力水平是影响信度的主要因素。测量标准误差属另类信度,可用于解释个体分数或解释分数差异。估计速度测验和掌握测验的信度,需使用特殊的方法。相似文献

8.

测验标准化

《中国考试》2003,(Z4)

测验质量的复核或交叉效度检验(crossvalidating)。经过试测和测题质量分析,挑选出了质量符合要求的测题,这些测题就构成了题库(item bank)。但由于试测所选的被试仅仅是被试总体的一个样本,难免受抽样误差的影响,因此还要进行第二次试测。也就是从被试总体中独立地抽取另一被试样本,施测后分析测题的难度和区分度,比较同一测题两次分析的结果是否一致,不一致的测题还需作进一步的分析和修改。这称为测验质量的复核或交叉效度检验。复核后的测验就进入了供测验选题的题库中。复本的制作。复本指两份完全等值的测验,所谓等值,是指有相同的测验目的,题型、题数、测相似文献

9.

基于最小鉴别信息加权的伪等组等值应用探究

凡细珍张敏强任杰彭恒利《中国考试》2022,(12):34-42+53

在无锚情况下,国外学者提出可利用被试背景信息变量对非等组的被试进行最小鉴别信息加权构建伪等组实现分数连接。为探讨和分析伪等组等值在我国测验情境中应用的准确性,采用实证数据,对比分析了伪等组等值与传统锚题等值的结果。结果显示,在被试背景信息变量与待等值测验分数的相关达到0.75左右时,伪等组等值所产生的等值误差接近传统锚题等值,其等值分数与传统锚题等值分数的对比结果也显示,伪等组等值不存在等值重要差异,即二者的差异不会带来实际影响。结果表明,在一定测验情境下,伪等组等值可以成为传统等值的有效替代。未来研究可对伪等组等值在不同测验情境中应用的准确性进行更多验证。相似文献

10.

测验的信度

一帆《教育测量与评价(理论版)》2009,(11):59-59

信度（Reliability）指测量结果的可靠性和一致性。也就是说,如果用同一测量工具反复测量同一种特质对象,则多次测量结果间的一致性程度就叫信度。测验的信度系数用rtt表示。相似文献

11.

3～4年级语文、数学单项学习能力倾向测验的编制

范晓玲石梦良陈方陈琳《教育测量与评价(理论版)》2009,(5)

目的:初编3～4年级语文、数学单项学习能力倾向测验,检验其信度和效度.方法:在查阅相关文献、进行专家访谈及多次预测的基础上形成语文、数学两套正式测验;采用分层和整群相结合的方法进行取样.结果:两套测验的平均难度均在0.46～0.50之间,条目鉴别力达到优良水平;语文和数学测验的重测信度分别为0.78和0.96,语文测验的重测复本信度为0.44,数学测验的复本信度为0.94,两套测验的Cronbach'α系数均为0.92;语文、数学单项学习能力倾向测验与3～4年级标准化成就测验的效标效度在0.40～0.79之间,与期末学科成绩的相关在0.58～0.86之间,语文测验一因子模型的解释力较强,数学测验两因子模型的解释力较好. 相似文献

12.

略论测验等值的理论_方法和应用

张敏强胡晖《华南师范大学学报(社会科学版)》1988,4(4)

在测验考试中,人们显然有种种理由要求比较、解释不同地区、单位、时间的同一学科的考试分数;在考试命题中,也有理由希望对同一学科不同形式的试卷、试题参数作比较,从而确保测验考试的公平和正确评价试题建立题库等等.这些,都涉及到“等值问题.所以,测验等值是考试研究中均一个非常重要的问题.一、测验等值的概念、作用、形式测验等值,是指对测量同一心理特质的不同测验分数或试题参数,通过一定的数学模型,转换成同一单位系统中的量数,以利于相互比较的方法.测验等值的转换,是独立于导出这种转换式时所使用的具体考生组的.好象天气预报时气温摄氏度数与华氏度数的互化有公式F=1.8c+32一样,不依赖于当初求得这一公式时是从气体还是从液体物质中取得的.这是测验等值的一个重要特点,也是一项根本的要求.并非任何测验都是可以等值的,首先,进行等值的测验必须是测量同一心理特质的测验.比如比较考生不同次测验的成绩,只能是对同一学科的成绩相互比较.所以.不能通过值转换,把语文分数转化为数学分数,把初等数学分数转化为高等数学分数.因为这些都相似文献

13.

测验等值中等值公式的研究

陈希镇《莆田学院学报》1999,(1)

通过对测验等值中线性等值公式进行研究,得到改进后的线性等值公式,该公式不仅与两测验的相关系数有关,而且同两测验的信度有密切联系。目前常用的线性等值公式是其当两份测验信度相等时的一个特例。相似文献

14.

心理与教育测量若干概念的应用问题 总被引：4，自引：0，他引：4

熊广星《广西师范大学学报(哲学社会科学版)》2000,36(3):63-65

心理与教育测量概念的应用要符合科学性：（一）用决定系数解释成因不能忽视共变关系,要估计到研究结论可能存在的片面性;（二）区分度不适用于大题作鉴别力指标,满分不同的题目也不宜作区分度比较;（三）用内部一致性系数估计信度须以任意两个被试对测验要测的各部分知识内容掌握程度的差别基本相同这一假设为前提,该假设不符合被试的真实状况,使得用内部一致性系数估计信度必然偏低。相似文献

15.

学习风格量表(Learnin Sgtyle Qsuestionnaire)的效度研究

白晶晶马颖峰《黑龙江教育学院学报》2011,(8):100-102

以Learning Styles Questionnaire在国内的使用进行效度研究为目的,在全国范围内选取了304个样本进行测验,问卷回收后利用SPSS15.0和VB6.0对数据进行统计分析,测验量表在中国使用的信度和效度。其结果为:内部一致性系数为r=0.766,复本信度为0.943、0.543、0.695、0.673,效标效度系数为0.626。研究结果表明Learning Styles Questionnaire在国内使用信度和效度尚可以接受,但有待于进一步提高。相似文献

16.

大学英语四级考试集库式完形填空的内容效度研究

袁慧《宿州教育学院学报》2014,17(5):124-125

本文旨在研究大学英语四级考试集库式完形填空的内容效度,即探索它是否能测量被试在篇章层次上理解和运用单词的能力。被试为上海某高校438名非英语专业学生,研究工具为四个测验。其中两篇测验（整A和整B）取自大学英语四级考试历年真题。另外两篇测验（散A和散B）,分别改编自整A和整B。随机抽取的高低两个水平的被试,分别完成了一个整篇原文测验和一个散句改编测验。结果显示,在整篇原文和散句改编测验中,高水平被试的成绩并没有体现显著差异;低水平被试整篇和散句测验成绩有显著差异。研究表明,可通过提高考点层次、适当增加选项的干扰性来提高大学英语四级集库式完形填空的内容效度。相似文献

17.

用验证性因子分析估计单维测验的信度

叶宝娟杨强《教育测量与评价(理论版)》2011,(11):8-12

α系数可能会高估或低估单维测验的信度,用验证性因子分析可以更好地估计单维测验的信度。本文介绍并比较了用验证性因子分析估计单维测验信度的4个信度系数：合成信度、最大信度、RΛ系数、RT系数,并通过比较,推荐应用者在不同的情况下,用合适的信度系数估计单维测验的信度。相似文献

18.

几种估计信度公式的对比研究

陈希镇《上海教育科研》1991,(1)

引言在教育和心理测验中,信度的重要性正被越来越多的人所重视。在经典测验理论中,信度的定义有两种,其一是用两份平行测验的相关系数作为信度的定义,另一是用真分数方差与观测分数方差之比来定义。由于编制两份完全平行的测验实际上难以做到,而学生的真分数又是个不可观测量,因此,上面的信度定义只是理论上构想的概念,在实际应用时必须根据一组实得分数采用一些变通方法加以估计。到目前为止,根据一份测验结果来估计信度的相似文献

19.

略论测验等值

漆书青《教育学术月刊》1987,(4)

测查同一心理特质的两个或多个测验的分数单位系统经过转换,从而使这些测验上的分数能够对应起来,就叫做测验等值或测验分数等值。这就好比度量温度的摄氏温度计与华氏温度计上的度数,经过单位系统的转换,从而可以实现互化一样。测验等值在测验实施,编制与结果分析,题库的建立,不同单位、地区、时间上的学科成绩的比较等方面,都是极为必要的。比如我们的高考,一般都有备用卷。当普通采用的正相似文献

20.

无锚题测验等值设计方法研究进展

《考试研究》2017,(3)

由于测验安全性、试卷组卷不当等问题,有些测验的题本相互之间不能或者没有设置锚题。对作答不同题本的被试进行分数比较时,需要用到测验等值技术。不同于有锚题测验能通过题本之间的锚题进行等值,无锚题情境下的测验需要借助于一些特殊方法进行等值。目前,对无锚题测验进行等值主要有三种方式,一种是通过测验中具体的题目,也就是构建相同的"锚题"来进行等值,如构造随机等组测验法和利用题目先验信息进行等值的方法;一种是通过构建相同被试组来进行等值,即构造随机等组样本法;还有一种是借助于测验题目所考查的认知属性来进行等值,一般是基于一种认知诊断模型——规则空间模型来进行操作。相似文献