期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

多面Rasch模型在主观题评分培训中的应用 总被引：7，自引：2，他引：7

李中权孙晓敏张厚粲张立松《中国考试》2008,(1):26-31

主观题的评分受到很多因素的影响,如评分者的知识水平、综合能力和个人偏好等。这些评分者偏差不仅会导致不同评分者之间存在主观差异,也会到导致同一评分者在不同的时间也具有主观不稳定性,最终导致主观题评分信度的降低。本研究将多面Rasch模型运用到某国家级考试论述题的评分培训中。通过分析6名有经验评分者对58份试卷的试评数据,鉴别出四种评分者偏差,然后据此对每个评分者进行个别反馈,从而提高评分的客观性和精确性。相似文献

2.

面试中的评分者贡献度指数及其应用

杨志明王雯丁港徐庆树《教育测量与评价(理论版)》2021,(10):3-7

面试是过程评价和综合评价特别是高水平大学选拔拔尖创新人才的重要手段.但目前常用的面试质量评价方法,如评分者信度或概化系数估计方法,并不能快捷评估每个评分者的工作表现,影响了面试的质量.借助经典测验理论和概化理论,通过逐一核查各评分者评分信息缺失条件下的信度估计值变化情况,构造了一个评分者贡献度指数,并举例展示其使用方法和注意事项,为实时监控评分者的表现、保障和提高面试质量提供了新的方法. 相似文献

3.

采用多面Rasch模型提高英语运用测试的评分质量

杨睿《开放教育研究》2011,17(5)

目前电大系统英语考试的口试和作文部分多采用语言运用测试的方式.语言运用测试由于引入评分者而使评分的主观性变大.如何控制评分者差异对考生分数的影响成为保证语言运用测试评分质量的重要环节.本文在比较了行为测试中评分质量控制方面常用的三种理论的基础上,着重介绍了多面Rasch模型在提高评分质量方面的贡献,并探讨了在电大系统如何采用该模型对英语运用测试中的评分者进行培训,以控制评分质量和提高考试信度. 相似文献

4.

网络双评过程中作文评分误差以及评分者效应的分析——以大规模英语考试作文评分为例

《中国考试》2015,(2)

目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。相似文献

5.

基于CTT、GT、IRT的评分者信度研究——以某届奥运会女子跳水决赛为例

钟晓玲康春花陈婧《考试研究》2013,(5):41-52

本文以某届国际奥林匹克运动会女子跳水决赛为例,综合应用CTT、GT和IRT三大测量理论进行评分者信度分析,从不同角度揭示评分者之间和评分者内部的差异情况。结果表明:CTT的评分者信度分别为0.981和078;GT的概化系数和可靠性指数分别为0.8279和0.8271,比赛中所采用的7名评委分别对选手在5轮上的跳水表现进行评定的决策是比较适宜的决策;在IRT中,相对而言,评委5在7名评委中最为严厉,评委2最为宽松,但评委之间在宽严程度上的差异不显著,评委1和评委4在自身一致性上存在问题,不同评委在评定不同选手、不同难度系数动作和不同轮数上存在偏差,但未达到显著性水平。基于本文的分析,可以了解三种评分者信度分析方法的特点及各自优势,为评分者培训和提高评分信度提供有用信息。相似文献

6.

对评分者信度检验中零假设的更正

胡咏梅《教育学报》2001,(11):37-41

我们通常采用Friedman双向秩次方差分析和Kendall和谐系数检验法来进行评分者信度检验.在绝大多数书籍中,此检验的零假设都被设置成"H0m个评分者对n个被评对象的评分是一致的".但是,这一零假设是错误的,本文将列举反例并给出正确假设的理论依据. 相似文献

7.

国家公务员考试面试评分者信度的研究 总被引：2，自引：0，他引：2

黄石卫《安徽教育学院学报》1998,(3)

本文分析了安徽省省级机关招考国家公务员面试的“评分者信度”,发现考官之间的评分具有较高的一致性。这说明考官的评分主要取决于考生答题的因素,而非考官本人的无关因素,即考试具有客观性。相似文献

8.

对评分者信度检验中零假设的更正 总被引：5，自引：0，他引：5

胡咏梅《学科教育》2001,(11):37-41

我们通常采用Friedman双向秩次方差分析和Kendall和谐系数检验法来进行评分信度检验。在绝大多数书籍中，此检验的零假设都被设置成“Ho:m个评分对n个评分对n个被评对象的评分是一致的”。但是，这一零假设是错误的，本将列举反例并给出正确假设的理论依据。相似文献

9.

评分员对不同体裁作文评分的多面Rasch模型分析

《考试研究》2018,(1)

主观性测试中,评分员差异是影响测试信度、效度和公平性的重要因素。本文采用多面Rasch模型考察8位评分员对记叙文和议论文两种体裁各60篇作文的评分情况。结果表明,评分员对不同体裁作文的评分存在不一致性:在评分员层面上,评分员的严厉度基本不受体裁的影响,但在评分员的信度与内在一致性方面,议论文评分好于记叙文评分;在评分量表层面上,评分员在评定语言和内容项目上,议论文比记叙文严格,而在条理项目上,议论文比记叙文宽松,并且议论文高分的使用频率比记叙文高。本文还就评分员评分的不一致性的原因进行了探讨,以求为降低评分偏差提供参考。相似文献

10.

成人高考网上阅卷的评分者差异研究 总被引：1，自引：0，他引：1

高丙成秦旭芳《乌鲁木齐职业大学学报》2007,16(4):96-99

采用四评模式的网上阅卷既有优点也有不足,本文通过调查法对辽宁省2006年10月份成人高考网上阅卷的评分者差异进行了研究。结果表明,评分者之间在阅卷速度、阅卷平均分、阅卷标准差及出分率等方面均存在差异。评分者评分过程中在阅卷速度、出分率方面逐渐提高,在阅卷标准差方面逐渐降低,在阅卷平均分方面差异不明显。并通过访谈法归纳出了及时反馈、严格要求、做好培训、减少误差阈值等减少评分者差异的有效策略。相似文献