首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
一种改进的ID3算法   总被引:2,自引:0,他引:2  
ID3算法是决策树学习的核心算法。本文论述ID3算法的基本思想和实现方法,针对原有算法的不足之处,提出了一种基于属性优先权的新算法,并通过实验证明改进后的算法具有更高的决策效率。  相似文献   

2.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

3.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了ID3决策树算法的基本思想,讨论了 ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程.  相似文献   

4.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

5.
针对现有决策树中ID3算法倾向于取值较多的属性的缺点,提出一种利用优化法的思想来改进信患增益的算法。用ID3算法及改进后的算法建立金融企业决策树分类模型,利用某银行提供的客户信息和银行业务信息等数据,通过客户存款情况,探讨对金融客户进行分类,研究忠实客户的特征。实验中两个方案的比较表明,利用优化法算法来选择决策树分支取值,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。特别是在使用决策树算法来挖掘的数据越多,算法的效率和性能就越好,算法的优越性就越明显。  相似文献   

6.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

7.
ID3算法是构造决策树的一种经典算法,传统的ID3算法存在很多问题,研究者提出了多种改进算法。简要概述基于粗糙集、粒计算和分类矩阵的ID3改进算法,通过实验分析对比3种改进算法的优势和不足,并对ID3算法的应用前景提出展望。  相似文献   

8.
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法.该算法通过将计算属性相对于划分的重要度作为选择扩展属性根结点的标准,递归地生成决策树,可以克服ID3算法偏向于选择取值较多的属性的不足.  相似文献   

9.
ID3算法是决策树归纳分类算法的一种。通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并运用改进算法构造决策树。  相似文献   

10.
基于ID3算法的决策树研究与应用   总被引:1,自引:0,他引:1  
在ID3算法的基础上,提出了一个在决策树各级节点上,以信息增益作为节点属性选择的标准,对每个非叶节点进行了测试类聚,并将例子集分成不同子集,实现了决策树创建和相应规则的生成新算法.实验结果表明该实现方法是正确和高效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号