期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

吴雪峰柳烨琛殷缘《外国语文》2018,(5)

本文在回顾、分析国内外独立型、综合型等各类英语写作测试评分标准的基础上,探索构建写作评分标准的一般规律,尝试设计英语写作测试评分标准模型。为考查该模型的有效性及可操作性,本文以概要写作为例,根据该模型设计相应评分标准,并采用多层面Rasch模型进行效度验证。结果表明:评分标准区分度和效度较好,评分员与评分标准间存在显著偏性交互作用;个别分数段的使用存在非拟合现象。最后,根据效度验证结果对评分标准进行了针对性修改。总体而言,评分标准模型具有较好的效度和一定的推广价值。相似文献

2.

多面Rasch模型在口语主观性试题网上评阅中的应用研究

彭恒利李蕊《考试研究》2015,(3):16-26

选取MHK口语试题实测数据,运用多面Rasch模型的理论和方法对人工评分与计算机自动评分的严厉程度、评分员内部以及各评分员之间的一致性程度进行研究,分析了两种评分方式在严厉度、一致性等方面存在的具体差异,以及不同试题之间是否存在难度差异,希望据此为提高MHK阅卷的科学化水平及命题质量提供依据和建议。相似文献

3.

评分员对不同体裁作文评分的多面Rasch模型分析

《考试研究》2018,(1)

主观性测试中,评分员差异是影响测试信度、效度和公平性的重要因素。本文采用多面Rasch模型考察8位评分员对记叙文和议论文两种体裁各60篇作文的评分情况。结果表明,评分员对不同体裁作文的评分存在不一致性:在评分员层面上,评分员的严厉度基本不受体裁的影响,但在评分员的信度与内在一致性方面,议论文评分好于记叙文评分;在评分量表层面上,评分员在评定语言和内容项目上,议论文比记叙文严格,而在条理项目上,议论文比记叙文宽松,并且议论文高分的使用频率比记叙文高。本文还就评分员评分的不一致性的原因进行了探讨,以求为降低评分偏差提供参考。相似文献

4.

外语写作思辨能力评价效度研究——基于多面Rasch模型分析

《外语教学理论与实践》2021,(2)

采用多面Rasch模型,以913名高中生为研究对象,从被试、评分员、任务和评分标准四个层面对外语写作思辨能力评价进行效度验证。研究结果显示:(1)包含提出问题、表达观点、提供证据、推理论证、得出结论、阐释评价的评价框架符合多面Rasch模型的测评要求,能体现并合理区分被试的外语写作思辨能力。(2)推理论证和提供证据对测试结果的整体效度有一定影响,需要进一步完善。研究结果对于外语教学中的思辨能力培养与评价具有一定的启示意义。相似文献

5.

第二语言口语考试评分方法述评

王佶旻《暨南大学华文学院学报》2007,(1):24-31

评分是影响口语考试信、效度的重要因素。口语考试的评分方法可以分为主观评分和客观或半客观评分两种。前者主要有总体等级评分和分项等级评分,后者主要有机器评分、分项客观指标评分和0/1制评分。本文对这几种评分方法进行了梳理和总结,并指出了每种评分方法的优劣。文章还对评分方法与口语能力定义、评分方法的选择以及评分与测验效度的关系等问题进行了讨论。相似文献

6.

采用多面Rasch模型提高英语运用测试的评分质量

杨睿《开放教育研究》2011,17(5)

目前电大系统英语考试的口试和作文部分多采用语言运用测试的方式.语言运用测试由于引入评分者而使评分的主观性变大.如何控制评分者差异对考生分数的影响成为保证语言运用测试评分质量的重要环节.本文在比较了行为测试中评分质量控制方面常用的三种理论的基础上,着重介绍了多面Rasch模型在提高评分质量方面的贡献,并探讨了在电大系统如何采用该模型对英语运用测试中的评分者进行培训,以控制评分质量和提高考试信度. 相似文献

7.

评分人培训的研究现状及展望

《中国考试》2014,(2)

评分人培训是保证做事测试分数信、效度的重要方法,一直是国际语言测试界关注的重点。本文首先从理论框架、培训方法和培训效果等方面对评分人培训研究的现状进行了回顾,然后指出了当前研究中的两个问题:培训过程及内容不清楚,培训产生作用的机制不明确。最后,文章就下一步的研究进行了展望,希望能引起我国语言测试工作者对评分人培训的重视。相似文献

8.

Rasch模型在小学科学素养评测质量分析中的应用

朱文琴《考试研究》2022,(1):38-48

为克服经典测量理论存在的测量依赖性和样本依赖性,本研究将Rasch模型应用于小学六年级学生科学素养评测的质量分析中,从整体质量检验、单维性检验、怀特图、单题质量分析、气泡图等方面介绍了Rasch模型在质量分析中的应用。同时指出该评测设计的题目信效度高、区分度合理,绝大多数题目达到了测量预期。Rasch模型在评测设计中的应用,为评测设计提供了一定的测量质量数据的参考。相似文献

9.

多面Rasch模型在英演讲比赛中的应用研究

张冰《高考(理化生)》2013,(9)

针对影响演讲比赛打分结果的各种误差来源,本文引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用不但有利于有效测量考生的能力水平,而且为识别问题评委、完善评分规则、及评委培训等问题都提供了全新的解决思路。本文同时也介绍了多面Rasch模型的理论及其在演讲比赛评分中的应用框架。相似文献

10.

高考英语阅读与中国英语能力等级量表对接的实证研究 ——以江苏省高考英语阅读为例

姜子芸《辽宁科技学院学报》2019,21(1):73-75

本研究由12位专家参与,使用修订式Angoff法对接2016年江苏省高考英语阅读和中国英语能力等级量表,包括四个步骤:熟悉阶段、考试说明阶段、标准设定阶段和效度验证阶段,并采用多层面Rasch模型分析专家判断的一致性。结果表明,专家判断具有良好的外部一致性,江苏省高考英语阅读对应量表四级,原始分的分界分数为58.9%。研究最后对于对接量表实验进行了分析和总结。相似文献

11.

大规模英语考试作文评分标准效度验证

《中国考试》2016,(1)

本研究收集评分员对130篇大学专业英语八级考试(TEM-8)作文的评分数据,采用多面Rasch模型分析法以及有声思维法收集证据对TEM-8作文评分标准进行了多维度效度验证。结果表明,评分标准大体上能够反映写作理论构念,评分尺度划分较为合理;大部分评分员能够有效使用评分标准进行评分,可信度较高。相似文献

12.

Rasch模型在试卷质量分析中的应用——以小学科学六年级技术与工程素养评测试卷为例

柏毅朱文琴陈慧珍《教育测量与评价(理论版)》2019,(1):25-31

与传统测量模型相比,Rasch模型因其客观和等距的特点在试卷质量分析中独具优势。本文以南京市小学科学六年级技术与工程素养评测试卷的质量分析为例,从试卷整体质量检验、单维性检验、试卷难度与学生能力的匹配性检验、各题质量分析、题目拟合度和测量误差检验等方面介绍了Rasch模型在试卷质量分析中的应用,同时指出该评测试卷的信效度较高、题目区分度合理,绝大多数题目达到了测量预期。在具体应用中,测量者应依据实际情况选择合适的Rasch分析软件及Rasch模型对应的分析功能;在Rasch模型检测出试卷中的问题项目后,测量者应依据实际情况解释和处理这些问题项目。相似文献

13.

基于多面Rasch模型的初中英语口语测试EBB评分标准研究与效度验证

《中国考试》2016,(12)

评分标准是测试构念的可操作化体现。本文介绍了EBB评分标准的定义和优势,尝试了如何基于考生真实的测试表现数据,为一项低风险的大规模初中英语口语测试制定EBB评分标准,并基于项目反应理论,利用多面Rasch模型对其进行效度验证。研究结果表明,包含语音语调、准确性、交际有效性和任务完成度四个评分维度的EBB评分标准符合分割指数、平均测量值和未加权均方拟合指数等关键测量指标要求,具有较好的效度,并且分数段划分合理,可操作性强。相似文献

14.

基于多面Rasch模型的评分质量分析——以一次英演讲比赛决赛为例

张冰《兰州教育学院学报》2013,(12):137-138

本文针对来自评委影响演讲比赛打分结果的各种误差,引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用可以为识别问题评委、诊断评委自身的一致性及评委之间的一致性和评委培训等问题提供全新的解决思路。相似文献

15.

主观题评分标准研究 总被引：1，自引：0，他引：1

周群《考试研究》2007,(1)

本文以2006年上海市高考政治学科论述题评分标准为例,从三个方面研究如何评价主观题评分标准的优劣,即每个评分项是否具有相对独立性;根据若干评分项的结果是否能够推测出考生的综合论述的能力;每个评分项等第划分是否合理。因子分析表明该主观题四个评分项具有单维性,一个因子可以解释为考生的综合论述能力。相关分析表明四个评分项均具有相对独立性,对推测考生的综合论述能力起到了彼此独立的作用。Rasch评分量表模型分析显示,各评分项等级划分基本合理,但个别等级出现信息量不足,在此基础上,提出了改进评分标准的若干建议。相似文献

16.

试卷结构的多维度研究:基于Rasch模型的视角

李付鹏宋吉祥杜海燕《考试研究》2020,(2):90-95

以在Rasch基础上拓展的多维随机系数多项式Logit模型(MRCMLM)为基础,对某高考数学试卷可能存在的三种能力维度模型进行验证性因素分析,最终确定了一种最佳的维度模型,并在该模型框架下进行多维试题分析。相似文献

17.

怀特图在Rasch多面分析中的应用

《考试周刊》2019,(5)

在教育与心理测量中,Rasch测量模型具有客观和等距量尺的特性。本文利用怀特图对某学校一份数学考试成绩进行了多面Rasch分析。结果表明,相比于经典测量理论,基于Rasch测量模型的试题分析评价更加客观。相似文献

18.

大学生单身恋爱焦虑问卷的初步编制

周永红石怡《中国校外教育(理论)》2014,(27):67

目的:编制适合我国国情的大学生单身恋爱焦虑问卷并对其进行信效度检验,为恋爱焦虑研究提供测评工具。方法:在文献分析和访谈法的基础上,形成初测问卷;对345名被试施测,通过探索性因素分析和验证性因素分析形成正式问卷。结果:大学生单身恋爱焦虑问卷共有三个因子:人际魅力、未来发展、舆论压力。问卷验证性因素分析结果表明,三因素模型各项指标拟合良好。结论:大学生单身恋爱焦虑问卷具有较好的信效度。相似文献

19.

全国翻译专业资格(水平)考试英语二级笔译试题效度分析

周赟赟《佳木斯教育学院学报》2012,(4):267+284

全国翻译专业资格(水平)考试(CATTI)是为加强我国外语翻译专业人才建设于2003年形成的一项新兴考试。本文选取2010年下半年至2011年下半年三次二级笔译试题为研究对象,从内在效度、外在效度、使用效度这三个方面对该试题进行效度分析,以期对提高试卷质量有一些帮助。相似文献

20.

学科核心素养学习进阶的效度验证

田一张咏梅李美娟《中国考试》2023,(11):45-54

建构有效的学科核心素养学习进阶,对贯彻和落实新的课程标准具有重要意义。借鉴国际学习进阶效度验证框架,依托质性和量化的混合实证研究方法,对已开发的学科核心素养学习进阶模型进行效度验证。基于证据中心设计研发情境任务,选取北京市30所中小学校测试41 103人次,对作答数据开展基于言语报告的文本分析和基于心理测量模型的Rasch分析。结果验证了学科核心素养学习进阶模型的有效性,为学习进阶在课程、教学和评价上的应用提供理论支撑和实证依据。相似文献