期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

柴省三《中国教育信息化》2014,(4):81-85

随着计算机信息技术的发展和多媒体网络教学设备的日益普及,基于项目反应理论（IRT）的计算机自适应性（CAT）语言测试由于在测验信度、测验效率和考试安全性等方面比传统的纸笔测验具有更大的优势,因此针对计算机自适应性考试的理论问题和实践问题正在成为教育考试信息化研究的热点之一。文章在对自适应性考试原理进行考察的基础上,专门就计算机自适应性语言测试,特别是对国内外计算机自适应性阅读理解考试过程中遇到的智能选题单位和方法问题进行了探讨。并对具体的解决途径进行了研究。相似文献

2.

中国汉语水平考试(HSK)远程CAT阅读测试模式研究

柴省三《中国远程教育(综合版)》2013,(6):81-87,96

随着计算机科学和互联网技术的日益普及与发展,以项目反应理论(IRT)为基础的计算机自适应性考试(CAT)正在成为远程教育测量的重要手段之一。不过,CAT测量模式在语言测试,特别是在经典阅读理解测试中的应用一直受到题库参数结构和计算机自动选题操作机制的限制。本文在对CAT测量原理和核心技术进行考察的基础上,专门就中国汉语水平考试(HSK)在计算机自适应性阅读理解测验的实现过程中存在的问题进行了考察,并提出了以文本属性参数为标准的HSK远程计算机自适应性考试的设计理念。相似文献

3.

基于概化理论和边际效用递减法则的测验长度研究

柴省三《考试研究》2014,(1):48-55

测验长度(test length)是影响语言测试信度和效度的重要因素之一。本文借助概化理论(Generalizability Theory,GT)的固定侧面s×(i:p)嵌套设计和边际效用递减法则(the Law of Diminishing Marginal Utility),对中国汉语水平考试(HSK[中级])的测验长度进行了实证研究。研究结果显示:由130题构成的HSK[中级]测验具有相当高的测验信度,概化系数(Eρ2)可达0.8890,即使将测验的题目数量减少至120题或110题,测验的概化系数仍可以达到0.8856和0.8816(分别降低了0.38%和0.83%),这种测验长度的缩减不仅明显地降低了研发成本,而且提高了测试效率,完全能够满足标准化考试在误差控制方面的较高要求,并确保测验结果和分数解释具有较高的信度和效度。相似文献

4.

CAT考试系统在大学英语测试中的应用

李洪斌《华章》2011,(26)

本文简要介绍了计算机自适应考试系统(CAT)的基本理论、设计思想和实现方法,探讨了CAT在语言测试应用中的优越性,指出在大学英语测试中采用CAT是大势所趋,我国高校英语教师应尽早熟悉和开展对CAT的研究与开发. 相似文献

5.

远程计算机辅助普通话水平测试的改进策略研究

朱丽红韩世梅《中国远程教育(综合版)》2013,(11):74-79

随着互联网技术的普及和发展,计算机自适应性语言测试的理论和实践问题成为远程教育策略模式研究的热点之一。作为国家级测试的普通话水平测试也需要顺应时代需求,利用网络实现管理、测试、培训和研究的现代化。本文在对现有计算机辅助普通话水平测试系统存在的问题进行分析的基础上,提出如下改进策略:①利用技术优势,改进"读单音节字词"和"读多音节词汇"的呈现方式,提高测试信度,并逐步向基于网络的自适应语言测试方向迈进;②对"朗读短文"和"命题说话"采取自动评分和人工评分相结合的方式,引入远程呼叫服务,实现准即时评分,以提高语言测试的反馈效果,同时避免计算机在语篇运用能力方面自动评分的不足。相似文献

6.

计算机自适应考试及题库建设

李向民《教学与管理》2007,(3):67-68

一、计算机化考试的理论基础随着认知科学、语言测试理论的发展以及测试手段和方式的不断更新，现代语言测试已经从过去对测试结果的关注逐渐深入到测试的过程，测试的结果应该能够反映出测试者之间细微的个体差异。计算机化考试，包括正在进行中的美国ETS组织的托福和GRE计算机化考试（CBT--Computer-based Test），也正是在利用先进的技术手段，使大规模的测试更加科学规范，更具有效率。从理论发展来看，计算机考试经历了以下几个过程。相似文献

7.

自适应性英文水平测试系统的设计与实现

张墨《绥化学院学报》2010,(2):185-188

考试作为衡量人才能力的重要手段,在当前社会有着极为重要的作用.现有的考试手段不够完善,因此,需要一种新的考试手段来弥补不足.系统就是为了这一目的而开发的.论文详细介绍了基于项目反应理论的自适应性英文水平测试系统的设计与实现方法.该系统按照软件工程的要求开发,实现了自适应性测试的基本要求.. 相似文献

8.

考试分数等值的新框架 总被引：1，自引：0，他引：1

谢小庆《考试研究》2008,(2):4-17

对考试分数进行等值处理不仅是保证测验信度和公平性的重要环节,也是建立题库和实现计算机化自适应性考试的核心环节。由美国教育协会(ACE)和全美教育测量学会(NCME)联合组织编写的《教育测量》一书被称为教育测量领域中的"圣经"。在2006年出版的《教育测量》(第四版)中提出了一个关于考试分数等值的新框架。本文介绍了这一新框架,并结合作者多年从事考试分数等值的实践,对等值问题进行了讨论。相似文献

9.

浅析计算机自适应考试系统在大学英语测试中的应用前景

李慧《中国现代教育装备》2009,(3):27-29

本文介绍了基于项目反应理论（IRT）的计算机自适应考试系统（CAT）的基本理论、设计思想和实现方法,探讨了CAT在语言测试应用中的优越性,指出在大学英语测试中采用CAT是大势所趋,我国高校英语教师应尽早熟悉和开展对CAT的研究与开发。相似文献

10.

大学英语写作测试的多模态及应试策略分析

王晓惠《海外英语》2012,(21):11-13

英语作文一直是写作测试的唯一形式,因为写作测试是一种综合性测试。它不仅检测学生的词汇、语法、用法等语言要素,而且测验学生分析能力,表达能力,逻辑推理的能力。随着测试理论的发展,写作的测试模式越来越多样化。现把各种写作模式进行归纳,比较分析,总结其各自的特点。目的是帮助学生掌握写作方法,提高英语写作能力。同时对大学英语的应试策略进行深入的探讨和研究,使学生掌握恰当正确的考试方法顺利地通过各种类型大学英语过级考试。相似文献

11.

英语语言测试预测效度优化研究-以托业考试为例

米龙龙《长治学院学报》2013,(1):71-73

效度是评价语言测试的重要标准之一,多年来不同学者从各方面对语言测试效度进行了大量研究,很多学者认为预测效度很难测量。本文通过分析托业考试的理论基础和相关题型来探讨如何优化英语语言测试预测效度。相似文献

12.

PETS三级口语考试评分质量控制研究——基于多侧面Rasch模型(MFRM)的方法

张洁《考试研究》2008,(4):65-78

口语考试作为一种相对真实(authentic)和直接(direct)的测试手段,已被越来越广泛地应用于语言测试实践中。然而,在测试过程中引入的主观判断、评分标准和量表的设计与使用等因素,使分数受到更多考生能力以外因素的影响。本研究基于2007年某考点PETS三级口语考试数据,用多侧面Rasch模型(Many-facet Rasch Model,简称MFRM)对这次考试的评分进行了事后质量控制研究。MFRM将语言运用测试多方面因素综合在一个数学模型中,不仅能够把所有侧面在同一标尺下进行衡量,还能对单独侧面,甚至每个个体进行具体分析,有针对性地找到潜在的"问题评分员"和可能被误判的考生,是主观评分环节有效的质量监控手段。相似文献

13.

全国计算机技术与软件专业技术资格（水平）考试质量评价与分析方法

徐玉彬谭志彬沈林兴《中国考试》2006,(10):42-45,53

全国计算机技术与软件专业技术资格(水平)考试属于目标参考性测验,但又具有常模参考性测验的特点,以此为出发点,本文从测量误差模型出发,分析并提出了一套计算机软件考试的质量评价指标,这些指标包括测验效度、信度、难度、区分度等,并以经典测验理论为基础,提出了一套有效的、可操作的计算方法。质量评价结果对于指导命题、改进教学、完善考试大纲、合理评价人才具有重要意义。相似文献

14.

交际法语言测试理论在德语确认考试中的应用

李康康翁震华王群珉《黑龙江教育学院学报》2011,30(2):156-157

Bachm an提出的交际法语言测试理论在其研究领域占据了主导位置。如何在外语测试中运用交际法语言测试理论,客观地设计测试原则,从而使测试具备真实性、准确性和可行性,留学德国的德语确认考试不失为成功的例子。借鉴德语确认考试的成功经验,可以对改革大学外语应试教育提供新思路。相似文献

15.

大学英语四级考试对高职英语教学的反拨作用

王文花《读与写:教育教学刊》2013,(4):26-27

语言测试的反拨作用是指语言测试对语言教学和学习所产生的影响,对语言测试的反拨作用研究是应用语言学的一个新兴研究领域,在语言测试研究中占有极其重要的地位。而作为由教育部高等教育司主持的每年两次的全国大学英语四级考试(CET-4)是面向全国高等学校非英语专业在校生的标准化英语能力测试,目前每年考生超过100万,是公认的最权威的英语水平测试之一,对我国的大学英语教学有着极大影响。本文拟在反拨作用视觉下分析大学英语四级考试对高职英语教学的影响。相似文献

16.

等级考试与量表对接的实践典范——评《听力测试:二语听力测评的研究与实践》

《兰州教育学院学报》2019,(2)

《听力测试:二语听力测评的研究与实践》由剑桥大学出版社出版,是《语言测试研究》(SiL T)系列丛书之一,反映了剑桥ESOL考试近十多年测试实践及效度验证的研究路径。基于听力测试研究文献与成果非常有限以及我国正在建设"车同轨、量同衡"统一测试体系的现状,本研究认为书中的二语听力测试理论和英语听力测试案例对我国英语能力等级考试具有重要的参考价值,特别是英语听力考试的研发、现行英语考试对接国家英语等级量表、参照等级量表进行分级标定、效度验证等方面。相似文献

17.

谈《QBasic语言》教学与全国计算机等级考试的结合

刘河《平原大学学报》2001,18(4):91-92

QBasic语言是流行最广的计算机高级程序设计语言之一,本文论述了如何对QBasic语言教学从课堂教学和上机实践两个方面大力改革和加强,以及与全国计算机等级考试二级考试(QBasic语种)相结合的尝试. 相似文献

18.

语言测试及相关理论与大学英语课程考试试题命制原则探究

夏船王敏《中国科教创新导刊》2013,(8):41

语言测试用于语言教学,其目的在于正确和客观地评价学生的语言能力。本文通过论述语言测试理论发展的四个阶段及相关理论,针对大学英语课程考试试题在评价学生语言能力方面的命制原则问题进行了初步探讨。相似文献

19.

项目反应理论在考试系统试题库中的应用

龚利《十堰职业技术学院学报》2015,(2):103-104,107

介绍了在网络考试系统中,经典测试理论(CCT)和项目反应理论(IRT)的优缺点,项目反应理论(IRT)理论模型及其应用,可以实现网络考试系统在组合试卷题目时,全面解决考试等值问题及参数估计更为准确等问题,使得考试系统能更科学地挑选试题。相似文献

20.

语言测试的社会公平性问题的实证研究——汉语水平考试的DIF检验

黄春霞《湖北招生考试》2011,(24)

任何一种测试都要公平、公正,否则就失去了它存在的价值和意义。对语言测试的公平性问题的研究是测验开发者不可推卸的责任和义务。汉语水平考试(HSK)是专门为汉语作为第二语言的学习者而设计的语言测试。经过二十多年的发展,HSK在公平性问题研究方面已经取得了长足进展。针对HSK特有的考生构成特点,本文将考生数量较少的非亚裔考生当作研究对象,将其设为目标组,考察HSK是否会对这个亚群体考生不公平。本文运用3种传统的DIF检验方法——MH方法、SIBTEST方法和Logistic regression方法,对HSK【初中等】一套试卷的听力理解测验进行DIF检验,比较目标组(非亚裔考生)和参照组(亚裔考生)在同一组项目上的表现。相似文献