首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

2.
决策树是一种重要的分类方法.本文分析了单变量决策树和多变量决策树的不足,提出一种基于核属性的决策树构造算法,该算法根据核属性存在的不同情况,选择结点的分裂属性.所创建的决策树规模适中,导出的规则简洁、支持度高.实验结果分析表明,该方法是有效的。  相似文献   

3.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

4.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

5.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法.该算法通过将计算属性相对于划分的重要度作为选择扩展属性根结点的标准,递归地生成决策树,可以克服ID3算法偏向于选择取值较多的属性的不足.  相似文献   

6.
决策树是数据挖掘中重要的分类算法,通常用来形成分类器.ID3算法是决策树中的核心算法.针对ID3算法倾向于取值较多的属性的缺点,引进属性重要度对ID3算法予以改进,并通过实验对改进前后的算法进行了比较.实验表明,改进后的算法是有效的。  相似文献   

7.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

8.
文章主要采用数据挖掘技术中的决策树C4.5算法,对本校学生成绩中的大量数据进行处理,从中选取决策属性,构造决策树,并提取分类规则,从而获取不同类型的学生与成绩之间的关系.试验结果表明,C4.5算法能够将数据进行准确分类和预测,最终得到有价值的结论,供教师决策分析.  相似文献   

9.
分类算法是数据挖掘中的一种重要技术,决策树学习是其中常用的一种方法。结合实例阐述了决策树基本算法的形成过程,分析总结了决策树算法在实际中的应用及其存在的缺陷。  相似文献   

10.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

11.
决策树是一种简单而且应用广泛的分类算法。一个决策表中包含大量的样本信息,一个样本就代表一条基本的决策规则。为了从决策表中抽取适应性大的规则,就需要对决策表进行属性约简。使用粗糙集理论对决策表进行约简比较出色。在用辨识矩阵方法对决策表进行属性约简时,需要考虑实现约简的一些技术问题。如建立决策表的可辨识矩阵,对所有取值非空集合元素建立相应的析取逻辑表达式,对析取表达式进行合取运算等。在VB编程环境下,实现了该算法的约简过程。实例仿真表明了该算法对于决策表属性约简是可行的。  相似文献   

12.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

13.
Attribute reduction is necessary in decision making system. Selecting right attribute reduction method is more important. This paper studies the reduction effects of principal components analysis (PCA) and system reconstruction analysis , SRA) on coronary heart disease data. The data set contains 1723 records, and 71 attributes in each record. PCA and SRA are used to reduce attributes number (less than 71 ) in the data set. And then decision tree algorithms. C4.5, classification and regression tree ( CART), and chi-square automatic interaction detector ( CHAID ), are adopted to analyze the raw data and attribute reduced data. The parameters of decision tree algorithms, including internal node number, maximum tree depth, leaves number, and correction rate are analyzed. The result indicates that. PCA and SRA data can complete attribute reduction work. and the decision-making rate on the reduced data is quicker than that on the raw data: the reduction effect of PCA is better than that of SRA. while the attribute assertion of SRA is better than that of PCA. PCA and SRA methods exhibit good performance in selecting and reducing attributes.  相似文献   

14.
Web服务(Web Services)是计算机网络技术研究热点之一,主要用来研究应用程序在Internet上实现互操作,拓展应用程序的功能。近年来,电子商务迅速崛起,Web服务数量不断增加,很多Web服务提供的功能是相似的,用户难以找到最适合自身需求的Web服务。使用决策树ID3算法,分析影响Web服务功能的质量参数,将其作为属性特征,得到Web服务的分类,帮助用户更好地选择合适的Web服务。  相似文献   

15.
增强突发事件研判、预警与快速响应能力,对加强网络舆情监管与引导,维护社会安全和稳定具有重要意义。首先基于网络舆情演化机制与特征建立科学、合理的指标体系;然后选取重要程度与分类性能均比较优异的末级指标作为特征属性,构造 C4.5 决策树风险预警模型;最后将突发事件网络舆情相关数据带入风险预警模型,得到预警风险等级。实验结果表明,该方法能够对突发事件网络舆情进行风险预警,预警准确率高达94.7%。  相似文献   

16.
TM遥感影像能获取丰富的地面信息,适合于大面积的宏观监测,文章利用分层分类的方法提取南京江宁区土地利用信息,获得了土地利用变化图,并对土地利用分类方法中的决策树分类和监督分类方法中的最大似然法在实践中的应用和精度比较进行了探讨,最后结合GIS空间分析方法对分类的结果图进行比较分析,并分析其变化的原因.  相似文献   

17.
经典决策树算法不能处理树构建和分类过程中的不确定数据,针对这一局限,提出基于概率分布的方法,把决策树分类技术扩展到含有不确定数据的环境中。然后,针对软件外包评价中普遍存在着不确定数据,应用决策树分类方法,对软件外包公司进行客观评价。实验表明,本文提出的基于不确定数据的决策树分类算法能够实现对软件外包评价的定量研究。  相似文献   

18.
阐述数据挖掘的分类及目的,总结分类器的构造方法,讲述分类中决策树的构建和修剪.  相似文献   

19.
社交网络的快速发展,微博成为主要的社交媒体平台,针对如何预测微博文本的未来互动数,对微博进行有效的分发控制的问题,提出一种基于并行决策树的微博互动数所属级数预测的方法。首先,对用户以往发表的微博进行用户特征和微博文本特征的处理;然后,使用并行决策树分类算法对训练数据进行分类模型的构建;最后使用得到的分类模型对新微博文本的互动数所属级数进行分类预测。通过对比算法的实验,验证了所提方法具有较高的分类精度和较好的可扩展性,能够对微博所属级数进行有效的分类预测。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号