首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
本研究利用多面rasch模型(MFRM)评估大学生"多元统计方法分析"课程的能力水平,并分析题目的难度和评分者的严苛度。研究结果显示,多面Rasch分析可以很好地解决开放式考试中对于学科能力的评估,其评估结果与学生的反馈一致。  相似文献   

2.
目前电大系统英语考试的口试和作文部分多采用语言运用测试的方式.语言运用测试由于引入评分者而使评分的主观性变大.如何控制评分者差异对考生分数的影响成为保证语言运用测试评分质量的重要环节.本文在比较了行为测试中评分质量控制方面常用的三种理论的基础上,着重介绍了多面Rasch模型在提高评分质量方面的贡献,并探讨了在电大系统如何采用该模型对英语运用测试中的评分者进行培训,以控制评分质量和提高考试信度.  相似文献   

3.
基于多层面Rasch模型,研究分析某省随机抽样高中考生短文朗读和自由交谈两种口语考试任务的评分维度及量表的使用情况。结果表明,短文朗读任务和自由交谈任务的评分维度设置均较合理,能够较准确地反映考生的能力,但是短文朗读量表的等级之间存在非等距性问题,自由交谈任务评分维度中"交际策略"与其他三个维度存在显著差异。这些信息对于修改和完善评分量表及相关维度具有重要意义。  相似文献   

4.
目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。  相似文献   

5.
影响大学英语口语测试的因素分析   总被引:1,自引:0,他引:1  
口语测试作为一种产出性试题,能对考生的语言能力进行直接的测试,对口语能力进行合理的测量,从而准确反映考生的口语水平。但是,口语考试的效度和信度受到口试形式、内容、原则多方面因素影响。  相似文献   

6.
本文依据Upshur and Turner(1999)考试与评分的理论模型,将考生口语产出的话语语言特征作为参照,研究口语考试中综合式与分析式评分的异同。实验结果表明考生口语产出的话语特征中流利度衡量指标之每分钟有意义音节数对两种不同评分模式都产生显著影响;评分员在两种评分过程中都注重考生话语的流利性,忽视语言准确性和复杂性。文章进一步对此进行了分析并从考生话语角度揭示口试评分中误差控制的问题。  相似文献   

7.
口语测试直接探测考生语言表现,考试主观性强,信度不高。本文结合测试构念、信息馈入与输出、考试形式、评分等口语考试环节,从信度、效度等质量指标入手,探讨构建科学口语评估体系的可行性做法。  相似文献   

8.
从语言使用的交互性来看,听力测试分为非互动型测试和互动型测试,这两种类型都存在于真实的语言交际活动中。实际上,现有的听力测试都是非互动型的;互动型听力测试被认为是口语测试的一部分。针对目前大型考试和高校对学生听力理解能力的测试都采用非互动型测试这一现状,提出在课堂环境下构建大学生听力理解能力的动态评估体系。以大学生为研究对象,组织他们分别参加传统的非交互型测试和交互型测试,然后通过Rasch软件对成绩进行分析。研究结果显示,学生听力理解能力、评分者行为和听力测试题目难度的估计与考试类型有关。本研究只是一项尝试性研究,旨在为今后的相关理论和实践研究提供一定的参考。  相似文献   

9.
论英语口语考试的评分误差   总被引:1,自引:0,他引:1  
口语考试的评分是评分员基于评分标准对语言产出的认知处理过程,处理的目的就是解释考生之间的分数差异(score vari-ance)。用于解释分数差异的变量包括构念相关变量(construct-rele-vant variables)和构念不相关变量(construct-irrelevant variables)。如果构念不相关变量发生作用,那么评分就产生误差。考试误差可区分为系统性误差(systematic error)和随机性误差(randomerror)。随机性误差是评分误差控制的重点内容。口语考试评分误差的主要表现形式包括评分员的个性差异、回归均值趋势和假正态分布。我们可以通过分数差异分布和回归系数等统计手段验证口语考试评分误差的大小程度。本文还讨论了口语考试评分误差控制的目标、原则和方法。评估误差控制的目的就是最大化构念相关变量的作用,最小化构念不相关变量的影响作用;这就要求评分员在评分过程中坚持一致性、完整性和独立性三条基本原则;在手段的使用方面,口语考试的评分误差控制主要包括管理手段、技术手段和统计手段等。  相似文献   

10.
交际性测试被认为是最为理想的语言测试,而基于交际语言测试理论的交际性口语测试模式则代表了未来英语口语测试的发展方向。目前国内高校的大学英语口语测试存在模式单一,重知识轻技能,缺乏真实的语境,新科技手段运用不足,评估体系落后等问题。交际性口语测试是目前口语考试的最高形式,能够让考生表现真实的语言能力,对大学英语教学改革起到积极的促进作用。  相似文献   

11.
外语口语考试旨在对考生的口语能力进行公正、合理的测量,准确地反映考生的口语水平,从而推进口语教学的发展。但是,口语考试的效度和信度受多方面因素的影响。英语专业口语考试及其对教学和学习的反拨效应分析对提高学生实际语言运用能力具有很大影响。  相似文献   

12.
随着"出国热"的升温,参加雅思考试的考生人数逐年增加。从考生角度来考察,发现口语考试的结果太过主观;没有顾及到不同专业或不同工作对于学生或者员工语言的不同要求;只通知成绩而不向考生提供来自评卷老师的反馈和评价,考生没有获得提高英语成绩的信息。基于此,提出建立考生个人电子档案(E-portfolio)和根据学生专业或者员工工作领域的需要改变考试内容的两点建议,以期通过测试评价体系的改进,使雅思考试为考生今后的学习和工作提供一定的帮助。  相似文献   

13.
无论从语言的发展、学习语言的自然规律还是从用语言交际所采取的形式来看,说的能力的培养在语言教学与研究中都显得十分重要。因此目前我国大部分大专院校的外语课程测试中都增设了口语测试这个项目,口语测试注重于考察考生是否能运用英语进行有效的交流,这种做法已经被事实证明非常有利于培养学生的语言应用能力。然而,口语测试又是各种语言能力测试中最难实施的一类考试,这是由口试的双向性、主观性和个别化等特点决定的。  相似文献   

14.
关于大学英语测试制度改革的思考   总被引:2,自引:0,他引:2  
本文认为以多项选择题为主导的大学英语等级考试缺少结构效度,不能真正有效检测到考生的真实水平,且对外语教学也产生了不良的作用.但在尚且无法改变教师和考生应试心态的情况下,测试设计者可考虑将试题多样化,尽量采用考查运用语言水平的题型,在四六级测试中设立口语考试.总之,语言测试应全面反映被测试者的听、说、读、写等基本语言技能.  相似文献   

15.
单项填空题是普通高等学校全国统一考试英语试题(NMET)的一种重要题型。尽管由于这种考试方法被认为只能测试考生的语言接受能力(receptiveskills)而不能测试考生的语言产出  相似文献   

16.
OPI旨在对考生的口语能力进行公正、合理的测量,从而准确地反映考生的口语水平。但是对OPI进行研究发现,口语考试的效度和信度受到评分标准、考官素质和考生素质等多方面因素的影响。  相似文献   

17.
从试卷分析学的角度对剑桥英语Compact First考试的口语部分进行评析,旨在评估该测试在何种程度上能实现作为一种可靠、有效、真实且能反映考生语言应用能力的考试的目的,以期在教学实践中能够更好地运用这种语言测试方法。  相似文献   

18.
Rasch模型在研究生入学考试质量分析中的应用   总被引:1,自引:0,他引:1  
运用Rasch模型对2010年全国硕士研究生入学考试心理学专业基础综合考试进行分析。结果表明,该试题总体上是一套高质量的测验,试题的内容覆盖了所有能力水平的考生,且能够较好地区分考生的能力水平,达到了预期的选拔目的。但通过Rasch分析也发现,在试题中有个别题目没有达到预期的测量目标,可以考虑在今后的工作中对其做出相应的修改。基于Rasch模型的试题分析能为考生能力和试题质量分析提供更多的测量信息。  相似文献   

19.
硕士学位研究生英语入学考试是国家教委组织的全国统一考试,有很强的权威性、科学性。它的评价标准是高校优秀本科生能达到及格或及格以上水平。因此,试题有一定的难度,对考生的语言知识和技能有比较高的要求,要求考生既有理解语言的能力,又有运用语言的能力。考试包括主观性测试与客观性测试(主观试题占30分,客观试题占70分)。为了便于考生熟悉考试的形式,内容,为了帮助考生准备考试,本文将以全国硕士研究生入学考试大纲为依据,就考卷的各个部分分别介绍。  相似文献   

20.
本研究以概化理论和多面Rasch模型为工具,对某市教育教学能力测试的一批实测结果进行了分析,旨在探索影响此类测试评分的因素及其作用机制,为完善测试设计和评分培训提供依据。研究结果表明,影响教育教学能力测试的主要因素是任务难度、评委宽严、评委的跨任务一致性和任务的跨考生难度。当前的教育教学能力测试只适宜做相对决策,不适宜做绝对决策。建议在以后的测试中通过提高测试任务的数量和加强对评分员的针对性培训来提高评分可靠性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号