首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
阅读篇章的选择、多项选择题目的设计以及篇章数量与测验题目数量的拟合度问题,是影响阅读理解能力测试信度和效度的基本因素。篇章数量和题目数量的不同组合方式对阅读理解测验误差和信度的影响也不相同。本研究以中国汉语水平考试(HSK)的实测数据为基础,随机选择500名考生作为研究样本,借助概化理论的随机双面嵌套(nested)设计s×(i:p)分析了HSK阅读理解测验中的误差来源和结构,对篇章数量和题目数量的匹配合理性进行了检验。研究结果显示:增加文章数量和题目数量均可以提高测验的精度,但增加文章数量比增加题目数量对概化系数(Generalizability coefficient,Eρ2)的提高作用更有效;HSK阅读理解测验的篇章数量和题目数量的现行组合方式符合误差控制的原则和信度指标的要求。  相似文献   

2.
在大规模、标准化语言测验中,如何确保复本测验分数之间具有等价性和稳定性的问题,是测验分数信度高低的重要标志之一,也是测验结果解释和分数使用效度高低的重要证据之一.本文在对汉语水平考试(HSK)标准化开发程序和等值处理技术进行考察的基础上,重点对国内最近两年HSK考试使用的8份复本测验分数之间的稳定进行了统计分析.结果表明,HSK测验的复本分数之间具有较高横向稳定性,所有测验试卷的分数与标准卷均具有历时一致性.  相似文献   

3.
本文作者通过测试理论研究和数据分析,探讨了全国公共英语等级考试口语测试的信度和效度.就测试的信度而言,要侧重施测(准备形式和测试过程)、测试内容(长度、难易程度)和评分(评分标准、评分依据、评分者)等方面的可靠性.测试的效度则应检验该测试是否具有内容效度、表面效度、标准效度(预示效度和共时效度)和理论效度,同时利用可靠系数检验该测试的信度.  相似文献   

4.
运用多元概化理论与结构方程技术对SCL-90量表进行信效度分析,发现SCL-90量表各维度概化系数为0.67~0.85,可靠性系数为0.64~0.82,都达到中等水平,总分概化系数为0.968,可靠性指数为0.962,说明SCL-90量表分量表和总量表都具有较高信度,同时各个维度题量可以适当删减;对SCL-90量表进行结构效度分析发现,模型拟合指数较佳.综合认为SCL-90量表具有较好的信度与结构效度.  相似文献   

5.
HSK高等考试信度的多元概化理论研究   总被引:2,自引:0,他引:2  
本研究运用多元概化理论对HSK高等考试客观卷的信度、试卷结构、测验总分的合成、试题预测方式的改进等问题进行探讨,结果表明:(1)HSK高等考试客观卷的总体及各部分信度都较好,且测验总分的合成是合理的;(2)测验各部分内容对全域总分方差分量的贡献比例与预设的赋分比例基本一致,试卷结构较为合理;(3)在适当减少各部分题量的情况下测验的信度仍较高,今后可以考虑在正式考试中进行试题预测。  相似文献   

6.
对1989-2008年国内发表的有关明尼苏达多相人格测验(MMPI)的文章进行信度概化研究.对MMPI的10个临床量表和3个效度量表信度系数的报告情况、信度水平和变异性进行描述性分析;以样本类型、样本量等作为预测变量,探讨影响MMPI量表信度水平的因素.在此基础上,与国外关于MMPI的信度概化研究结果进行比较,结果表明二者在信度水平、信度系数的变异性及其预测源方面都存在异同.  相似文献   

7.
李桂梅 《考试研究》2009,(1):94-102
本文通过对HSK(改进版)[中级]的三份主试卷进行因素分析,认为HSK(改进版)[中级]主试卷考查了综合运用语言的一般能力,较好地体现了HSK的改进理念,符合语言能力本身的特点和语言测验的发展趋势,具有较高的构想效度。  相似文献   

8.
汉语水平考试(HSK)属于国家级考试,是专门用来测量外国人、华侨和国内母语非汉语的少数民族学员汉语水平的标准化测试手段。HSK的效度、信度、难度和区分度均已达到国家汉办制定的《汉语水平等级标准和等级大纲》以及《汉语水平考试(HSK)大纲》限定要求,能够准确地测定出考生的实际汉语水平和能力标准。我区高校都设有汉语预科班,民族中小学都设有汉语课。实行汉语水平考试(HSK)的主客观条件业已成熟。定期举办该项考试,并开展相关的学术活动,无疑将会推动我区汉语教学工作再登上一个新阶梯。  相似文献   

9.
概化理论提出了新的测量信度观并逐渐应用于大规模考试领域。本文运用多元概化理论对高等教育自学考试课程《综合英语(四)》听力测验的测量信度、测验总分合成、题型设计优化等问题进行探讨。研究发现:本次听力测验的总体测量信度较高,但"短文理解"分测验的测量信度较低;各分测验对全域总分的方差贡献比例与测验编制时的赋分比例存在一定差距;在删除"短文理解"分测验后将各分测验题量同时增至10题,可有效提高听力测验的测量信度。  相似文献   

10.
张洁 《考试研究》2015,(3):33-36
对国际汉语教师文化知识的测试方式及测试长度进行了讨论。分析在实测数据的基础上,认为文化知识的考试可采取客观题形式,但需达到150题方能具有较高的信度。  相似文献   

11.
白娟 《考试研究》2013,(1):51-57
全国硕士研究生入学中医综合考试,是为高等院校和科研院所招收中医药学专业硕士研究生而设置的、具有选拔性质的全国统一入学考试科目。本研究运用多元概化理论评估2012年中医综合考试的总体信度、试卷结构及二级学科分配比例的合理性。结果表明:(1)从考查的学科内容看,方剂学、中药学、针灸学、中医内科、中医诊断学的测量精度较高,而中医基础理论的测量精度相对偏低,可通过适当提高该学科试题的难度和区分度以增加测量精度;(2)从设置的题型看,各题型的测量精度均较高,各题型的分量分布较适当。  相似文献   

12.
阅读理解能力测验中所选择的文章在内容方面对不同专业背景的考生亚团体是否具有公平性的问题,是测验效度高低的重要证据,也是测验效度验证(validation)的重要环节。本研究以中国语言与文学专业考生为目标组,分别将经济学专业和生物医学专业考生作为参照组,采用效标测量和蕴涵量表分析相结合的方法,对HSK(高等)阅读理解测验的文章难度对三个不同专业背景的考生组的公平性问题进行了检验。研究结果表明,两个参照组考生尽管具有各自的相对专业优势,但他们在六篇阅读材料上获得的难度排列顺序与目标组考生完全一致;虽然目标组考生不具备汉语知识以外的其他专业优势,但因为HSK考试所选择的阅读材料没有涉及语言知识本身以外的特殊专业要求,因而测验对三个不同专业背景的考生具有较高的公平性。  相似文献   

13.
本文通过对2011年新汉语水平考试HSK(六级)8次考试的试题进行项目功能差异(DIF)分析,以评估其性别公平性。结果显示,800个试题中存在DIF的题目占总数的3.3%;800个试题的MH值平均数为0.02,其95%置信区间包含0,即试卷总体上不存在DIF。因此,HSK(六级)具有较理想的性别公平性。  相似文献   

14.
近年来,随着华语文学习需求的日益升高,使得以“母语为非华语者”的华语文能力测验也逐渐受到各国瞩目,然而,这些华语文能力测验仍有一些限制与不足之处。本研究目的是以欧洲语言共同参考架构(The Common European Framework of Reference,CEFR)为基础,参考蔡雅熏(2009)编制的《华语文能力指标》,研发A2级的华语文听力与阅读测验,并导人现代测验理论(item response theory,IRT)之技术,建立一套具有信度、效度的华语文能力计算机化测验。最后,本文透过次级量尺分数估计方法,探讨受试者在CEFR中四种语言能力之表现,研究显示受试者表达与理解能力优于互动与转述能力。  相似文献   

15.
概化理论(GT)提出了新的测量信度观并逐渐应用于大规模考试领域。本文将概化理论思想与方法引入自学考试信度分析研究与实践,提出了自学考试信度分析的概化理论研究框架。本框架对自学考试信度分析的基本任务与流程进行了梳理与总结,对一元概化理论(UGT)模型与多元概化理论(MGT)模型的应用进行了整合,选择了更为合理的自学考试信度指标并探讨了及格线决策信度的考察思路,为自学考试研究者进行概化理论研究提供一定程度的参考。  相似文献   

16.
德国经济学家戈森曾提出一个有关享乐的法则:"同一享乐不断重复,则其带来的享乐感逐渐递减[1](P210)。"由此演变出经济学中著名的边际效用递减规律。同时旅游产品因其具有较大的享乐消费性,因此更易受此规律的影响:比如旅游消费中的一次性、重游率低等现象。通过分析两者之间的关系,找出其内部的规律性,为旅游产品的合理开发与销售提供科学依据。  相似文献   

17.
本文介绍了汉语水平考试(HSK)(六级)的分数处理方案,该方案同样适用于新HSK笔试其他等级及新HSK口试,这一方案已在2013年考试中付诸实践。  相似文献   

18.
崔维真 《考试研究》2012,(6):88-93,50
本研究根据前人的研究成果,选用单维等级反应模型(GRM),对高等汉语水平考试(简称HSK[高等])口试进行了实验分析。实验假设,等级反应模型下的评分能够更加精细地区分被试的能力。最终实验结果证实了该假设。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号