首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
随着信息技术的发展,主观题智能评分成为考试与测评领域的研究热点。基于深度学习的主观题智能评分方法目前尚存在一定局限性:一是基于深度学习的方法通常需要充足的训练样本才能达到比较好的效果,而一些真实阅卷场景却无法提供充足的标定样本;二是评分模型仅预测总分值,缺少评分细节,无法为后续的结果评价提供依据。针对以上问题,提出基于领域预训练的孪生网络智能评分方法,探索利用考生作答文本提高评卷精度的方法,探索得分点模型的可行性与实现方法。实验证明,孪生网络智能评分方法能够有效提高小样本情况下的主观题智能评分精度。  相似文献   

2.
此研究以网上阅卷环境下多个评分者同时评阅翻译和作文为例,建立多个评分者完成多个任务的结构方程模型,对数据进行拟合,实现评分者信度的量化分析。通过五个结构方程模型比较,选择拟合效果较好的相关任务相关特性模型,计算多评分者多任务的评分者信度,并对同一评分者完成不同任务时评分者信度和同一评分任务下不同评分者的评分信度进行比较,实现对评分效果的评价,从而对评分者的选拔和有针对性培训提供科学支持。  相似文献   

3.
为了提高个人信用评分模型算法预测精准率,受视觉领域数据增广思路启发,提出融合数据增广技术与机器学习算法的个人信用评分模型。该模型首先对原始个人信用数据进行数据增广处理,然后基于机器学习分类算法训练一个二分类个人信用评分模型,最后基于公开个人信用数据集,分别建立未经过数据增广和经过数据增广处理后的个人信用评分模型。对比准确率、精确率、召回率、F1 得分、AUC 值和 ROC 曲线等 6 个性能评价指标,结果显示,相较于仅基于机器学习算法的个人信用评分模型,融合了数据增广技术与机器学习算法的个人信用评分模型使得分类性能得到了一定提升,分类准确率平均高出 5%。  相似文献   

4.
基于神经网络的个人信用评分模型研究   总被引:2,自引:0,他引:2  
在国际上,个人信用评分是个人信贷风险防范的重要环节,而中国目前还没有制定出一套规范的个人信用评分指标体系和方法。本研究利用真实的个人消费信贷数据,选择适合的字段作为指标变量并进行归一化处理,结合个人信用评分的特点,选择BP神经网络算法建立了个人信用评分模型。实证研究表明:该模型预测精确度较高,具有较强的判别预测能力,但稳健性却不是很理想;适用于样本分布不断变化或数据结构不太清楚的情况,但却存在过度拟合的问题。  相似文献   

5.
祝贵春 《山东教育》2005,(29):47-48
作为一名躬耕于高三语文教坛近20年的老教师,在了解了今年山东省语文试卷得分情况尤其是作文评分情况后,再也控制不住自己,不揣冒昧发表一下自己对高考作文阅卷的看法,希望能引起相关部门的重视。  相似文献   

6.
目前大规模考试作文评分大都采用双评评分模式,本研究采用多侧面Rasch模型(MFRM)分析双评模式下大型英语作文评分中的评分者误差来源及主要影响因素。对57名评分者所评价的2 427篇作文分析发现:1评分者的宽严度存在显著的差异;2在作文评分中,约有22.8%的评分者之间的一致性较差,也存在约3.5%的评分者之间一致性过高;3约90%的评分者自身的一致性都较高,但仍有8.8%的评分者自身一致性很差,约2%的评分者出现评分自身一致性过高的情况;4从整体上讲,评分者在不同的评分标准(或维度)上、不同评分等级宽严程度的把握存在差异;评分者和被试,以及评分者、被试和评分标准三者的交互作用不显著;5评分者对男生和女生具有相同的宽严度。  相似文献   

7.
计算机考试系统是评定用户对计算机基本操作的掌握情况一种有效的方法.本文对Windows操作部分,单独编写评分系统,评分的方法采用Visual basic(VB)编程语言中现有函数,编写函数过程,判断基本操作,如文件、文件夹的复制、移动、删除等开放式的评分系统更利于教学和考试,Windows部分同样可采用开放式编程思想.  相似文献   

8.
评分教师的评分效应和评分量表研究是研究主观题评分误差的核心问题。本论文以2006年高考政治(上海卷)第38题(论述题)为例,运用ACER Conquest的Raters Effect模型研究,结果显示该大题基本没有表现出模糊性、趋中性和等级限制等评分误差,评分教师能够比较好地区分考生不同行为特征,除个别评分教师的评分一致性还有待提高外,评分松紧度差异比较显著。为此,作者提出根据松紧度调整考试分数的方法。  相似文献   

9.
应用2013-2014 学年上海市研究生学位论文“双盲”抽检系统的数据,对评议专家在论 文评议中的评分异常现象进行分析,归纳出评分异常现象的基本判定规则,提出了“双盲”评议异常 监测模型,该模型主要利用多元回归法构建。通过上述数据,获取学位论文在选题、创新、学术性、 应用性和准确性等方面的评分异常监测系数,并用2013-2014 学年上海交通大学工程硕士专业学位论文“双盲”成绩进行评分拟合度实验,实验证实了模型的有效性。  相似文献   

10.
<正>2013年6月,笔者参加了安徽省高考文综卷地理学科的阅卷。在阅卷过程中,针对地理试卷的答题有些浅显的思考,据此提出相应的建议。一、关键词句应写在显眼处下表是2013年安徽高考地理主观题得分情况:由数据可知试卷主观题难度较大,特别是第34题(自然地理部分)难度大,得分较低。  相似文献   

11.
We outline a scheme for marking suggested edits and annotations on software specifications, a particularly complex class of structured document, during the process of review and correction. The scheme is based on a formal model of document construction and review and on typographic marking methods. The scheme permits precise and interpretable marking and annotation of documents which use many different notations. It supports and guides the process of correction. Some examples and a sample visual notation are given. Tool support for using this scheme is briefly discussed.  相似文献   

12.
13.
The marking scheme method removes the low scores of the contractor‘s attributes given by experts when the overall score is calculated, which may result in that a contractor with some latent risks will win the project. In order to remedy the above defect of the marking scheme method, an outlier detection model, which is one mission of knowledge discovery in data, is established on the basis of the sum of similar coefficients. Then, the model is applied to the historical score data of tender evaluation for ci...  相似文献   

14.
随着新课程改革的不断深入,教学理念逐步更新,学生的英语水平也在逐渐提高,但沿用多年的高考英语书面表达的评分标准并没有与时俱进,已经不能完全适应英语教学改革的要求。笔者认为,与《课程标准》相对照,它存在对学生的书面表达能力要求偏低的问题;与托福等考试的写作评分标准相比较,其整体评分方式不确定度相对较大,分项式描述不尽合理。针对上述问题,本文提出了"改良的整体评分法"的建议。  相似文献   

15.
让学生参与作业批改,让教师从繁重的作业堆中获得解放,这是对传统数学作业批改的一次挑战.在新的形势下,对数学作业批改模式的探讨和实践,值得广大数学教师在教学实践中作认真思考和大胆的尝试.  相似文献   

16.
This article examines 4 approaches for explaining shared method variance, each applied to a longitudinal trait–state–occasion (TSO) model. Many approaches have been developed to account for shared method variance in multitrait-multimethod (MTMM) data. Some of these MTMM approaches (correlated method, orthogonal method, correlated method minus one, correlated uniqueness) were therefore borrowed in these analyses such that their effectiveness could be evaluated in conjunction with a TSO model. To this end, datasets were generated according to 4 different covariance matrices (each created according to specifications of a model built with 1 of the 4 approaches) and each model was crossed with each type of data. Whereas the correlated method and correlated method minus one approaches encountered many difficulties in convergence, fit, or parameter estimates, the correlated uniqueness and orthogonal method approaches proved to be quite versatile.  相似文献   

17.
18.
在快餐文化充斥的新时代,英语专业学生的学习动机中融入了更多的功利主义因素。为了通过等级考试,英语学习者在学习中盲目贪快,一心只钻研与考试相关的内容,最终习得的只是能力不足的“快餐式”英语,并且在专业四级考试中失利。在充分了解学生的学习特点和心理特征后,英语教师应从三方面对学生的学习进行引导,严防快餐式英语的形成:激发学生的英语学习热情,培养自主学习能力;增加课堂教学的兴趣性,扩大文化知识面;合理利用模拟考试。  相似文献   

19.
20.
为验证并提高PETS五级听力构建题评卷信度,本研究随机抽取考生答卷进行试评,修订标准答案,采集答案修订前后考生答题数据进行分析,并以问卷形式等就如何提高构建题的评卷信度进行研究。研究结果表明,有必要在大规模评卷之前增加一次试评,根据试评中出现的具体情况充实、完善标准答案。为了提高构建题评分信度减少评卷人的主观判断,须加强评卷人培训,严格按照修订后的评卷要求和标准答案评卷并坚持复评制度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号