共查询到20条相似文献,搜索用时 156 毫秒
1.
2.
选取MHK口语试题实测数据,运用多面Rasch模型的理论和方法对人工评分与计算机自动评分的严厉程度、评分员内部以及各评分员之间的一致性程度进行研究,分析了两种评分方式在严厉度、一致性等方面存在的具体差异,以及不同试题之间是否存在难度差异,希望据此为提高MHK阅卷的科学化水平及命题质量提供依据和建议。 相似文献
3.
4.
《外语教学理论与实践》2021,(2)
采用多面Rasch模型,以913名高中生为研究对象,从被试、评分员、任务和评分标准四个层面对外语写作思辨能力评价进行效度验证。研究结果显示:(1)包含提出问题、表达观点、提供证据、推理论证、得出结论、阐释评价的评价框架符合多面Rasch模型的测评要求,能体现并合理区分被试的外语写作思辨能力。(2)推理论证和提供证据对测试结果的整体效度有一定影响,需要进一步完善。研究结果对于外语教学中的思辨能力培养与评价具有一定的启示意义。 相似文献
5.
王佶旻 《暨南大学华文学院学报》2007,(1):24-31
评分是影响口语考试信、效度的重要因素。口语考试的评分方法可以分为主观评分和客观或半客观评分两种。前者主要有总体等级评分和分项等级评分,后者主要有机器评分、分项客观指标评分和0/1制评分。本文对这几种评分方法进行了梳理和总结,并指出了每种评分方法的优劣。文章还对评分方法与口语能力定义、评分方法的选择以及评分与测验效度的关系等问题进行了讨论。 相似文献
6.
目前电大系统英语考试的口试和作文部分多采用语言运用测试的方式.语言运用测试由于引入评分者而使评分的主观性变大.如何控制评分者差异对考生分数的影响成为保证语言运用测试评分质量的重要环节.本文在比较了行为测试中评分质量控制方面常用的三种理论的基础上,着重介绍了多面Rasch模型在提高评分质量方面的贡献,并探讨了在电大系统如何采用该模型对英语运用测试中的评分者进行培训,以控制评分质量和提高考试信度. 相似文献
7.
8.
为克服经典测量理论存在的测量依赖性和样本依赖性,本研究将Rasch模型应用于小学六年级学生科学素养评测的质量分析中,从整体质量检验、单维性检验、怀特图、单题质量分析、气泡图等方面介绍了Rasch模型在质量分析中的应用。同时指出该评测设计的题目信效度高、区分度合理,绝大多数题目达到了测量预期。Rasch模型在评测设计中的应用,为评测设计提供了一定的测量质量数据的参考。 相似文献
9.
针对影响演讲比赛打分结果的各种误差来源,本文引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用不但有利于有效测量考生的能力水平,而且为识别问题评委、完善评分规则、及评委培训等问题都提供了全新的解决思路。本文同时也介绍了多面Rasch模型的理论及其在演讲比赛评分中的应用框架。 相似文献
10.
姜子芸 《辽宁科技学院学报》2019,21(1):73-75
本研究由12位专家参与,使用修订式Angoff法对接2016年江苏省高考英语阅读和中国英语能力等级量表,包括四个步骤:熟悉阶段、考试说明阶段、标准设定阶段和效度验证阶段,并采用多层面Rasch模型分析专家判断的一致性。结果表明,专家判断具有良好的外部一致性,江苏省高考英语阅读对应量表四级,原始分的分界分数为58.9%。研究最后对于对接量表实验进行了分析和总结。 相似文献
11.
12.
与传统测量模型相比,Rasch模型因其客观和等距的特点在试卷质量分析中独具优势。本文以南京市小学科学六年级技术与工程素养评测试卷的质量分析为例,从试卷整体质量检验、单维性检验、试卷难度与学生能力的匹配性检验、各题质量分析、题目拟合度和测量误差检验等方面介绍了Rasch模型在试卷质量分析中的应用,同时指出该评测试卷的信效度较高、题目区分度合理,绝大多数题目达到了测量预期。在具体应用中,测量者应依据实际情况选择合适的Rasch分析软件及Rasch模型对应的分析功能;在Rasch模型检测出试卷中的问题项目后,测量者应依据实际情况解释和处理这些问题项目。 相似文献
13.
14.
张冰 《兰州教育学院学报》2013,(12):137-138
本文针对来自评委影响演讲比赛打分结果的各种误差,引入多面Rasch模型对评分进行分析。此模型在分析评分结果中的应用可以为识别问题评委、诊断评委自身的一致性及评委之间的一致性和评委培训等问题提供全新的解决思路。 相似文献
15.
16.
17.
18.
目的:编制适合我国国情的大学生单身恋爱焦虑问卷并对其进行信效度检验,为恋爱焦虑研究提供测评工具。方法:在文献分析和访谈法的基础上,形成初测问卷;对345名被试施测,通过探索性因素分析和验证性因素分析形成正式问卷。结果:大学生单身恋爱焦虑问卷共有三个因子:人际魅力、未来发展、舆论压力。问卷验证性因素分析结果表明,三因素模型各项指标拟合良好。结论:大学生单身恋爱焦虑问卷具有较好的信效度。 相似文献
19.
周赟赟 《佳木斯教育学院学报》2012,(4):267+284
全国翻译专业资格(水平)考试(CATTI)是为加强我国外语翻译专业人才建设于2003年形成的一项新兴考试。本文选取2010年下半年至2011年下半年三次二级笔译试题为研究对象,从内在效度、外在效度、使用效度这三个方面对该试题进行效度分析,以期对提高试卷质量有一些帮助。 相似文献