首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 171 毫秒
1.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

2.
利用数据挖掘技术研究高职院校学生成绩的影响因素,对高职学生成绩管理具有重要意义。决策树法是数据挖掘的主要技术和方法,利用决策树C4.5算法系统研究了我校信息工程学院二年级学生成绩影响因素,建立了影响学生成绩的决策树模型,使学校有针对性的开展学生管理工作。  相似文献   

3.
首先介绍了CRM和数据挖掘的基本理论知识;然后通过数据挖掘在CRM中的主要应用和在CRM中启动数据挖掘的基本步骤两个方面对数据挖掘在CRM中的应用进行了详细的说明;最后对数据挖掘技术中的决策树分类算法应用于客户分类进行了研究,着重探讨了其中的SLIQ算法及其改进算法。  相似文献   

4.
介绍了数据挖掘技术的概况,对数据挖掘中的核心算法—决策树算法的原理进行了研究,特别说明了决策树属性的选择,给出了一个实例。  相似文献   

5.
决策树算法是数据挖掘领域的一个研究热点,通常用来形成分类器和预测模型,在实际中应用广泛。介绍了决策树技术及其发展过程,重点阐述了几种典型的决策树算法,分析了它们的优缺点,并对几种算法作了比较,最后探讨了决策树算法今后的发展方向。  相似文献   

6.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

7.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

8.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的方法。本文重点介绍了决策树建立的基本原理,对算法所面临的问题进行了阐述,为数据分类研究者提供借鉴.  相似文献   

9.
数据挖掘技术正以其强大的功能在许多研究和应用领域得到广泛的发展,分类预测算法更是有着广泛的应用前景,决策树算法是一种重要的分类方法,是数据挖掘领域研究热点之一。在学生管理工作中,运用决策树算法对海量的学生信息进行处理,在实际操作中,有着很高的参考价值。  相似文献   

10.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

11.
王琴竹 《运城学院学报》2011,29(2):53-54,57
决策树算法广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树算法中的过度拟合会在很大程度上影响到最终的分类结果。针对过度拟合产生的原因,采用悲观错误剪枝方法,对学生成绩决策数据进行分析,得出影响学生成绩的重要因素。实验表明,该方法可以得到尽可能短的分类规则,有效地提高了决策树的性能。  相似文献   

12.
为了克服排序学习算法不能处理包括名词性特征的复杂数据类型的局限性,设计一种新的排序学习算法.在决策树学习算法中,采用新的等级不纯度定义,修改决策树的分裂规则,得到具有直观解释的排序算法,并给出了相关理论基础.实验结果表明:排序树的平均等级损失明显优于感知机类算法和序回归类算法,且具有较快的收敛速度.基于决策树的排序学习算法,可以处理名词性数据和选择相关的特征.  相似文献   

13.
该文提出一种基于决策树的分类挖掘技术,在论述分类挖掘的基础上分析决策树分类挖掘系统的建立思想、步骤及算法,并把该系统应用到优化学生资源管理的实验中,实验结果证明了该方法的可行性。  相似文献   

14.
This article reports a study on using data mining to predict K–12 students' competence levels on test items related to energy. Data sources are the 1995 Third International Mathematics and Science Study (TIMSS), 1999 TIMSS‐Repeat, 2003 Trend in International Mathematics and Science Study (TIMSS), and the National Assessment of Educational Progress (NAEP). Student population performances, that is, percentages correct, are the object of prediction. Two data mining algorithms, C4.5 and M5, are used to construct a decision tree and a linear function to predict students' performance levels. A combination of factors related to content, context, and cognitive demand of items and to students' grade levels are found to predict student population performances on test items. Cognitive demands have the most significant contribution to the prediction. The decision tree and linear function agree with each other on predictions. We end the article by discussing implications of findings for future science content standard development and energy concept teaching. © 2007 Wiley Periodicals, Inc. J Res Sci Teach 45: 554–573, 2008  相似文献   

15.
为了解决服务器运行过程中由于性能故障造成服务质量下降的问题,提出一种基于决策树的日志分析方法,以服务器日志文件中记录服务器关键性能指标的数据为研究对象,利用决策树中常用的ID3、C4.5和CART 3种算法预测服务器未来性能指标发展趋势。实验结果表明,在实际运行过程中,C4.5算法对服务器性能指标数据预测的准确率和召回率最好,分别达到了92.23%和95.37%,在3种决策树算法中拥有最高的准确率与召回率,且相比传统开发人员从日志文件中寻找故障的方法,准确率提高了20%左右,因此能够更好地预测服务器系统性能指标发展趋势。通过该方法可提前感知系统运行状况,并及时作出调整,从而有效降低实际生产过程中服务器故障发生概率,提高服务质量。  相似文献   

16.
决策树学习是人们广泛使用的一种归纳推理形式。先就决策树和决策树学习算法进行介绍,然后用实例阐述决策树在教育信息处理中的应用,主要以在教学评价中的应用为例来加以介绍。  相似文献   

17.
Attribute reduction is necessary in decision making system. Selecting right attribute reduction method is more important. This paper studies the reduction effects of principal components analysis (PCA) and system reconstruction analysis , SRA) on coronary heart disease data. The data set contains 1723 records, and 71 attributes in each record. PCA and SRA are used to reduce attributes number (less than 71 ) in the data set. And then decision tree algorithms. C4.5, classification and regression tree ( CART), and chi-square automatic interaction detector ( CHAID ), are adopted to analyze the raw data and attribute reduced data. The parameters of decision tree algorithms, including internal node number, maximum tree depth, leaves number, and correction rate are analyzed. The result indicates that. PCA and SRA data can complete attribute reduction work. and the decision-making rate on the reduced data is quicker than that on the raw data: the reduction effect of PCA is better than that of SRA. while the attribute assertion of SRA is better than that of PCA. PCA and SRA methods exhibit good performance in selecting and reducing attributes.  相似文献   

18.
在对数据挖掘决策树的基本概念和常用算法进行介绍的基础上,针对生成决策树的常见问题提出了相应的处理方法。  相似文献   

19.
决策树方法在学生成绩分析中的应用   总被引:2,自引:0,他引:2  
决策树方法是数据挖掘技术中一个活跃的研究领域,该文采用决策树方法对学生成绩进行分析,以快速找到影响学生成绩的原因,有利于提高教学质量.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号