首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 125 毫秒
阅卷管理与监测系统─—大规模考试作文评分研究系列之六章熊上文说过,大规模考试中作文评分的误差控制包括三个不可缺少的基本环节,这就是评分标准、评分方法和阅卷管理。监测系统是阅卷管理系统中一个有特殊意义的组成部分。一次大规模作文考试,如果没有一套完善的管...  相似文献   

我省自学考试办公网络信息管理系统获得高教自考信息化成果三等奖本刊讯  (费扬洁 )在全国高等教育自学考试信息化成果评选活动中 ,我省自学考试办公网络信息管理系统获得高等教育自学考试信息化成果三等奖 ,这是我省将计算机技术应用于自学考试管理中的重要成果。 (详见第 5期《河北自学考试》杂志 )我省实行初中毕业与升学考试分离自今年起我省初中毕业考试与升学考试实行分离。除体育、物理实验和化学实验考试由市统一命题外 ,毕业考试的命题、制卷、考试、阅卷等工作由县级教育行政部门统一管理和组织。国家规定的 13门学科课程合格是…  相似文献   

自学考试的客观题机器阅卷因容易受到内外各方面因素的影响而会产生一定概率的误判。为了更好地维护自学考试作为国家考试的公平和公正性,需要分析可能存在的误判原因。本文描述了如何使用数字图像识别技术来提高答题卡的识别准确率,最大程度地降低识别误判率,以提高客观题的阅卷质量。  相似文献   

《公共关系学》是全国高等教育自学考试企业管理、市场营销、人力资源管理、国际贸易、行政管理、广告、文秘等专业必修的专业基础课。从近五年来的考试阅卷中笔者发现,相当一部分考生这门课程考得不够理想,得高分的考生更是凤毛麟角。那么,考生朋友如何才能在《公共关系学》自考中取得较好的成绩呢?下面结合近五年来考试的试卷情况进行分析,希望对考生朋友的自学与应考有所帮助。  相似文献   

大规模教育考试中要有效保障网上阅卷的质量,评卷教师的组织管理是其中的关键环节.本文对影响评卷教师网上阅卷质量的主要因素进行剖析,并根据多年的实践经验,总结出加强评卷教师的组织和管理以保障评卷质量的若干做法.  相似文献   

高等教育自学考试是国家学历考试 ,是我国高等教育的重要组成部分 ,担负着为社会主义现代化建设选拔合格人才的重任。阅卷是自学考试诸多工作环节的重要一环 ,如何做到客观、公正的评阅试卷 ,高质量的完成阅卷任务 ,是每个评阅工作者都需要认真研究、不断探讨的问题。本文就如何搞好自学考试阅卷工作谈一点粗浅的看法 ,不妥之处 ,请同行指正。一、建立健全自学考试阅卷机构搞好自学考试阅卷工作 ,必须有健全的领导机构 ,坚强的领导班子 ,这是搞好自学考试阅卷工作的关键 ,必须认真抓好。(一 )成立由主管自学考试工作的校长为组长 ,行政主管…  相似文献   

高等教育自学考试以其灵活、方便、客观等特点倍受社会乃至世界许多国家的关注,成为我国高等教育事业的重要组成部分。显而易见,高等教育自学考试是以考试为中心展开的学历教育,这种特殊性使自学考试的考风考纪在自学、辅导、考试、阅卷等教学环节中的重要性较之其他教育形式更胜一筹。因此,严肃考风考纪是增强高等教育自学考试生命力的关键。 严肃考风考纪可以调动考生学习的主动性和自觉性。高等教育自学考试是以考生自学为主的开放式学历教育形式,它没有全日制高等教育教学过程中的课堂提问、课下作业、期中测验等环节,考试是检验…  相似文献   

一年一度的上半年高等教育自学考试及阅卷工作结束了,阅毕最后一份试卷,我们长嘘一口气。回顾最近两次考试情况,我们感触颇多。  相似文献   

自动阅卷技术是大规模计算机考试的必然选择,本文针对<计算机文化基础>课程中的Office操作题中的Word部分进行了剖析,并研究了VBA技术实现在Office操作题自动阅卷中的功能.  相似文献   

本刊讯我省自学考试将开考“餐饮管理”专业(本科、独立本科段)。全国自考办与中国烹饪协会联手开设自学考试“餐饮管理”专业(专科、独立本科段),并开展“餐饮业职业经理人资格证书(包括经理人和高级经理人两种)”的培训和认证,这一证书将作为全国餐饮业统一的职业资格证书。据了解,中国烹饪协会将负责组织专家编写教材、贯彻国家标准、组织实施培训,全国自考办负责制定“餐饮管理”专业考试计划,有关课程考试大纲、命题、制卷和阅卷,以及考试的组织实施及相关的工作。据悉,通过“资格证书”课程考试的学员将获得“餐饮业职业经理人资格证…  相似文献   

国内外写作评分量表的对比研究   总被引:1,自引:0,他引:1  
陈睿 《考试研究》2011,(6):59-67
国外考试项目的写作通常采用小评分量表综合评分法,国内则采用大评分量表综合评分或分项评分法。国外写作评分量表的描述具体、详细,层次清楚,各评分等级间的差别可鉴别,便于评卷者操作。与小评分量表相比,评卷者在大评分量表下不能使用全距分值,容易给出趋中分数,评分员间的评分一致性较差。据此,得出小评分量表下"整体描述+分项具体描述"的综合评分法较大评分量表的综合评分法准确度高,评卷者易于掌握,评卷效率高,评分误差小,考试的公平性也可以得到有效保障。  相似文献   

用于计算机应用能力考核的计算机自动阅卷系统,主要包括计算机阅卷系统的组成以及计算机能力考核的内容和软件特点。实践证明运用计算机自动考核系统可以高效地、客观地进行各种类型的能力考核。  相似文献   

The National Board of Medical Examiners is developing a computer-based patient-simulation examination (CBX) to be used in the evaluation of the clinical competence of physicians. The Rasch partial credit model (RPCM; Masters, 1982; Wright & Masters, 1982) is used to scale examinee performance on the simulated patient case. This article describes the scoring and scaling of a CBX case to demonstrate how the RPCM can be used (a) to increase the quality of the examination by detecting errors in scoring logic and (b) to construct an explicit performance-based definition of the person measures for use in standard setting.  相似文献   

建构反应试题是自主招生考试的主要题型,其既有学业考查方面的优势,又有难以避免的评分误差。本文通过对2013年“华约”自主招生数学试卷的统计分析与质量评价,从总体评分、评分松紧度、评分趋中、量表等级限制、交互作用和侧面功能差异六个方面阐释建构反应试题评分误差产生的原因及其影响,在试卷评价的一致性、合理性和准确性的诉求下,提出在试卷的命制、评阅和反馈阶段消除和控制评分误差的建议,以提高我国基础教育的试卷评价质量。  相似文献   

开放教育考试直接成本主要包括试卷制作费、监考巡视费、评卷费。开放教育考试间接成本主要包括:考务管理费、上交上级考试费用。研究发现,规模越大的考试成本越低、技术含量越高的考试成本越高、越重视考风考纪的考试成本越大、考试性质也决定了考试成本的高低。应逐步建立健全考试成本管理制度,树立系统的成本管理理念,应用动因理论指导成本管理实践,通过预算管理控制考试成本。  相似文献   

In signal detection rater models for constructed response (CR) scoring, it is assumed that raters discriminate equally well between different latent classes defined by the scoring rubric. An extended model that relaxes this assumption is introduced; the model recognizes that a rater may not discriminate equally well between some of the scoring classes. The extension recognizes a different type of rater effect and is shown to offer useful tests and diagnostic plots of the equal discrimination assumption, along with ways to assess rater accuracy and various rater effects. The approach is illustrated with an application to a large‐scale language test.  相似文献   

Any examination that involves moderate to high stakes implications for examinees should be psychometrically sound and legally defensible. Currently, there are two broad and competing families of test theories that are used to score examination data. The majority of instructors outside the high‐stakes testing arena rely on classical test theory (CTT) methods. However, advances in item response theory software have made the application of these techniques much more accessible to classroom instructors. The purpose of this research is to analyze a common medical school anatomy examination using both the traditional CTT scoring method and a Rasch measurement scoring method to determine which technique provides more robust findings, and which set of psychometric indicators will be more meaningful and useful for anatomists looking to improve the psychometric quality and functioning of their examinations. Results produced by the more robust and meaningful methodology will undergo a rigorous psychometric validation process to evaluate construct validity. Implications of these techniques and additional possibilities for advanced applications are also discussed. Anat Sci Educ 7: 450–460. © 2014 American Association of Anatomists.  相似文献   

技能课是实现高职高专培养目标的主干课程,技能课考核内容和方向是实现培养目标和技能课课程目标的最重要的保证措施之一。应改革技能课考核形式,采用表现性评价方式,运用绝对评分法,制定技能课考核量表,引领技能课教与学的内容和方向,提高学生的职业技能水平。  相似文献   

在线测试系统能极大地增强网络课件的交互性,从而有效地提高学习者的学习效果。无需编程基础,利用Lectora软件的测试和评分功能即可实现在线测试系统的用户登录、试题库管理、测试反馈等功能。  相似文献   

The 2-MEV model is a widely used tool to monitor children's environmental perception by scoring individual values. Although the scale's validity has been confirmed repeatedly and independently as well as the scale is in usage within more than two dozen language units all over the world, longitudinal properties still need clarification. The purpose of the present study therefore was to validate the 2-MEV scale based on a large data basis of 10,676 children collected over an eight-year period. Cohorts of three different US states contributed to the sample by responding to a paper-and-pencil questionnaire within their pre-test initiatives in the context of field center programs. Since we used only the pre-program 2-MEV scale results (which is before participation in education programs), the data were clearly unspoiled by any follow-up interventions. The purpose of analysis was fourfold: First, to test and confirm the hypothesized factorized structure for the large data set and for the subsample of each of the three states. Second, to analyze the scoring pattern across the eight years’ time range for both preservation and utilitarian preferences. Third, to investigate any age effects in the extracted factors. Finally, to extract suitable recommendations for educational implementation efforts.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号