首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 187 毫秒
1.
在计算机自适应测验中,利用计算机来模拟生成被试和题库,对于选题策略的实验模拟是非常重要的。主要叙述均匀分布、正态分布样本的生成算法以及正态分布的检验方法。  相似文献   

2.
计算机化多阶段测验(MST)主要由阶段和模块组成,在这样的框架结构下,计算机化多阶段测验不仅具备适应性考试的优点,而且能够发挥专家的智慧。本文介绍MST结构的特点和选择,梳理MST结构的相关研究。未来研究应进一步关注题库、考生能力分布等影响因素下的结构比较,并深入探讨分类测验的MST和多维MST的基本结构。  相似文献   

3.
计算机化自适应测验(CAT)在理论与实践中得到广泛应用。目前许多CAT研究可以归纳为两种研究范式:实测作答的CAT研究范式和测验作答数据模拟的CAT研究范式。CAT模拟研究方法的步骤有模型选择、题库模拟、测试起点、选题策略、测验终止策略等。CAT模拟研究的主要趋势有:选题策略、终止策略仍然是CAT研究的重点;CAT模拟研究的设计内容更适合实际测验情况;CAT研究设计采取多因素设计;模拟结果多方面综合评价等。  相似文献   

4.
计算机自适应测验(Computerized Adaptive Testing,简称CAT)是用项目反应理论建立题库,并由计算机根据被试能力水平自动选择测题,最终对被试能力作出估计的一种新型测验,其目的在于通过被试正确回答题目难度的高低来评价其能力。  相似文献   

5.
民族地区国家通用语言测验题库的创建是一个系统工程。在构建题库的过程中,首先要制定题库的描述性参数体系,并以能力维度和文本维度标注所有试题。之后是确定最优的IRT统计参数估计模型和等值参数转换方法为Logistic双参数模型和同时校准法,使得试题的IRT统计参数能够统一到一个量表上。最终构建的题库由50多套试卷的试题及其描述性参数和统计参数构成,涵盖测验所需测查的各种能力和文本,各项参数指标良好,能够保证测试的有效性和高信度。  相似文献   

6.
基于项目反应理论的测验编制方法研究   总被引:3,自引:0,他引:3  
本文在简单介绍项目反应理论的基础上,从计量分析的角度,深入探讨了应用项目反应理论编制各种测验的一般步骤;探讨了项目反应理论题库建设方法及基于题库的测验编制方法;探讨了标准参照测验合格分数线的划分方法。  相似文献   

7.
基于计算机的测验已逐渐普及,但不同的计算机测验形式在测量相同任务时可能会产生测验结果的偏差,从而导致教育测量与评价结果的不公平性。文章基于项目反应理论,探讨了计算机化线性测验与计算机自适应测验在测验效率、测验结果的统计学特征及其对考生个体心理特质的影响是否等效等问题,并以师范生"现代教育技术"课程为例开展了实证研究,结果显示:两种测验中考生的分数具有可比性,计算机自适应测验具有更高的测验效率与测验信度,但有无即时反馈对考生测验焦虑的影响较大;而计算机化线性测验具有更合理的内容效度,有无即时反馈对考生测验焦虑的影响较小。文章的研究不仅对教学评价中测验形式的选择是否公平合理进行了科学分析,而且为施测者根据测验场景有针对性地选择测验形式提供了理论参考。  相似文献   

8.
用项目反应理论编制标准化考试题库系统,旨在探究教育测量的新理论应用,为学科教育评价提供辅助工具。题库以四年级数学为测验内容,按标准化编制项目施测、评分、分析,其中选用三参数的逻辑斯蒂克模型,并用贝佳法检验了测验的单纬性,利用ANOTE软件估计项目参数,用基于题目分类下的经验判断法建立一个划界分数,接合项目信息量组成题库,最后讨论了能力估计方法、抽题策略、结束控制等题库编制的关键技术。  相似文献   

9.
根据教育测量学的题库建设理论,通过组织测验样本,对题库题目进行预先测试,运用题目统计分析技术的有关算法,可以获得测验题目的难度值、区分度等相关技术参数.运用计算机的UML统一建模技术,构建题库题目难度的智能修正模型,可以实现题库中大量题目难度值的智能化运算和修正工作,从而进一步保证计算机题库建设的科学性.  相似文献   

10.
计算机自适应测验是现代教育测验的一种新形式。计算机自适应测验的指导理论与传统纸笔测验不同,而且测试方面有诸多的优点。本文详细介绍计算机自适应测验的基本测试流程,包括被试即时能力估计、选题策略、曝光率控制、测验终止标准等八个基本步骤;并进一步论述了计算机自适应测验在实测中应解决的关键技术与问题:在线参数估计、试题与测验交叠率控制、纸笔测验与计算机等值、多维评价与认知诊断等。  相似文献   

11.
一种新的测验形式——计算机自适应测验   总被引:1,自引:0,他引:1  
计算机自适应测验(Computerized Adaptive Testing,简称CAT)是近年来发展起来的一种新的测验形式。这种测验以项目反应理论为基础,以计算机技术为手段,在题库建设、选题策略等方面形成了一套理论和方法。本文将简单介绍计算机自适应测验的原理和方法。  相似文献   

12.
本研究采用“共同题?锚测验”设计,使用R语言ltm程序包中的IRT两参数模型进行各年级小学生数学学力认知诊断测验和被试参数的估计,并使用equateIRT程序包进行跨年级小学生数学学力认知诊断测验各项参数的等值转换。结果表明,等值转换后各年级测验的题目难度和小学生数学学力均随年级增长而逐渐递增,不同学校、民族、性别学生的数学学力发展差异性特征均与理论假设相符。本研究验证了采用IRT垂直等值方法构建跨年级小学生数学学力发展水平垂直量表的可行性,为制定系统性补救教学方案和自适应题库建设提供了必要的实证证据。  相似文献   

13.
《考试周刊》2016,(88):41-42
对两个处理的假设测验,现有t测验一种方法。本文选用两个事例,其中一个是完全随机设计的成组资料;另一个是随机区组设计的成对资料,分别进行了t测验和F测验,结果表明:对于这两种资料,可以用t测验,也可以用F测验。t测验和F测验的数学关系为F=t~2;F_(α/2)=t_(α/2)~2。根据方差分析中对误差自由度的要求,推导出成组资料至少需要7次以上的重复,成对资料至少需要13次以上的重复。  相似文献   

14.
测验等值设计新探讨:ETP设计   总被引:1,自引:1,他引:0  
项目反应理论框架下新的基于题库的大型测验的等值设计:等值到题库设计(ETP设计),与其他传统等值设计相比,可以避免传统共同组设计和共同题设计的一些缺点,并能够在保证等值精度的情况下对测验进行等值。在目前许多大型考试已有题库的情况下,ETP设计具有较大的发展空间。  相似文献   

15.
我国基础教育目前存在很大的城乡差别、地区差别。“广州市基础教育学业质量监测系统”是建立在IRT理论和CAT技术基础上的,长久可用、持续有效、可比较的教学质量监测指标体系,其目的是解决目前中小学教学学业质量监测由于区域差异、自主选材等因素带来的诸多问题。项目组通过大量模拟研究,已取得一定成果,但题库建设、“锚”测验题库和保密工作将是该系统的一项长期工作。  相似文献   

16.
2008年,美国教育部发布了<国家数学顾问团的报告>.报告中的"教学评估"专题主要基于美国成就测验的广泛应用这一背景,对测验的内容、测验成绩的分类、测验项目和测验设计提出建议.美国数学专家组通过调查研究发现,美国数学教学评估在"测验项目和测验设计"方面存在一些问题,如测验项目"措辞"上的问题、测验程序研发中出现的漏洞、测验项目上的争议,等等.笔者对这些问题进行简单介绍,并对其进行思考,进而提出在测验编制和项目设计上的一些建议.  相似文献   

17.
物理题库计算机管理系统,以现代教育理论中的经典测量理论为依据,以计算机科学技术为手段,能够对物理教学中大量使用的各类测验试题进行研究编审、分类存储和有效管理,能按照试卷生成理论和工作方案的要求自动组成试卷供教学评估和考试使用。这其中,自动组卷系统是物理题库计算机管理系统的一个主要组成部分,它能够根据输入的考试内容、试卷难度系数、考试时间以及同类试卷份数等不同的要求,在题库中快速自动的生成所需的试卷。自动组卷的核心包括两个部分:一是根据输入或缺省的试卷指标自动生成每道试题的试题指标;二是在题库中搜索查找与试题指标相匹配的试题,组成测验试卷。  相似文献   

18.
一些学校一直热衷于标准化测验,但专家认为,使用计算机适应性测验可能更有利于学校发展,因为计算机适应性测验在这几个方面具有优势:能激发学生的挑战和自信,提供更多有关学生个体成长的数据、促进教师的专业发展、创建和谐的教学环境。  相似文献   

19.
当前课程改革背景下,中小学教育教学质量监测领域面临着难以有效评估不同地区、学校、班级教学质量等难题。本文从技术角度提出了质量监测中测验及考试改革的建议:一是在传统测验形式下采用"锚"测验,以解决比较问题;二是改革测验形式,引入计算机自适应测验。两种方法可依不同的质量监测要求分别使用或混合使用。  相似文献   

20.
本文介绍了当前国内外采用的考试形式,国外以自适应测验为主,国内以纸笔测验为主。计算机自适应测验相对于纸笔测验有很多优点,其中最重要的是自适应测验的测验结果在不同测验中具有可比性、有基于认知诊断的自适应测验,而纸笔测验不能提供被试测验进一步的信息。自适应测验是未来测验的发展方向。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号