首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
主要研究决策树ID3算法及其改进算法,阐述ID3算法的基本思想及存在的不足,并根据ID3算法中信息增益计算原理的特点,利用凸函数的性质简化信息增益的计算,提高ID3算法中信息增益的计算效率.  相似文献   

2.
决策树是数据挖掘中简单常用的分类算法,它是一种以实例为基础的归纳学习算法,来发现数据模式和规则[1,2]。根据ID3算法,对股指期货自然人投资者数据样本进行分析,获得不同属性上的信息增益,最后生成决策树,可将此树转换成一个if-then规则的集合,并找到数据建模的规律和模式,提取有价值的信息,为证券公司扩展业务,增加客户,规避风险做出科学的决策支持。  相似文献   

3.
介绍了一种一般情况下的C4.5数据挖掘算法的优化方法。原来的C4.5算法在计算属性信息增益率时需要大量用到对数运算,而优化后的C4.5算法计算属性信息增益率时只需用到加减乘除运算,在实现时不用频繁调用对数函数,优化后的算法不会改变属性信息增益率的排序,不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下,减少时间复杂度,提高了决策树生成效率。  相似文献   

4.
介绍了数据挖掘的相关概念,数据挖掘中决策树ID3算法的相关概念以及信息增益和信息熵概念。通过实例介绍了ID3算法的主要内容,指出了ID3算法的不足及改进之处。针对该实例提出ID3算法的一种改进算法——MIND算法,并通过MIND算法重新计算实例内容。最后通过实例分析将改进算法与ID3算法进行对比,证明了改进算法的有效性。  相似文献   

5.
传统的医学文献检索算法FP-Growth算法存在效率低下、内存溢出等问题,据此提出了一个改进的FP-Growth算法.首先将数据集平均分块,以并行的方式构建FP-Tree树,以减少内存负担,再以粒子群算法优化FP-Growth的FP-Tree树迭代过程,并优化并发过程.经验证,改进后的算法能提高内存的使用率与算法的运行效率.  相似文献   

6.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了ID3决策树算法的基本思想,讨论了 ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程.  相似文献   

7.
随着智慧农业的发展,农业生产中海量数据不断涌现。在海量数据中难免存在噪声数据,这些数据不仅难以提供有效价值,还会影响信息挖掘。针对该问题,采用基于密度的DBSCAN聚类算法进行异常数据处理。鉴于DBSCAN算法对参数敏感,结合数据集本身特性与统计学思想以绘制各点之间的距离升序曲线,预估出DBSCAN的Eps参数。仿真实验结果表明,改进算法平均准确率达到99.6%,较传统算法提高了1.7个百分点,并且在10次检测中,改进算法只有3个数据判定错误,证明该参数设置方法对异常数据处理准确率更高,稳定性也更好。  相似文献   

8.
数据结构是计算机程序设计的重要理论技术基础,在软件开发中选择好正确的数据存储结构和算法是关键。赫夫曼树在程序开发和工程中均有较高的使用价值,通过实例介绍了在软件开发中如何利用赫夫曼树建立最佳判定算法,从而提高程序的执行速度。  相似文献   

9.
介绍了在Visualbasic6.0环境下,如何对某一给定的数据集合采取一些算法思想,结合TreeView控件来实现现在软件设计上比较通用的多级树型目录,此方法在数据库设计、分类信息资料等的归纳分类中有着十分重要的意义。  相似文献   

10.
针对现有决策树中ID3算法倾向于取值较多的属性的缺点,提出一种利用优化法的思想来改进信患增益的算法。用ID3算法及改进后的算法建立金融企业决策树分类模型,利用某银行提供的客户信息和银行业务信息等数据,通过客户存款情况,探讨对金融客户进行分类,研究忠实客户的特征。实验中两个方案的比较表明,利用优化法算法来选择决策树分支取值,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。特别是在使用决策树算法来挖掘的数据越多,算法的效率和性能就越好,算法的优越性就越明显。  相似文献   

11.
从分类的角度进一步阐述了信息熵的概念,使得利用信息熵的方法构造决策树有了更加坚实的数学基础,研究了信息熵与决策可信度的关系,给出了利用信息熵计算决策最大和最小可信度简单、直观易操作的算法,在期望信息熵较小时计算得出的最大和最小可信度是非常接近的,因此可以用它来做估计决策可信度的依据,实验结果也表明计算的结果和实际的决策可信度是非常接近的。  相似文献   

12.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

13.
基于ID3算法的决策树研究与应用   总被引:1,自引:0,他引:1  
在ID3算法的基础上,提出了一个在决策树各级节点上,以信息增益作为节点属性选择的标准,对每个非叶节点进行了测试类聚,并将例子集分成不同子集,实现了决策树创建和相应规则的生成新算法.实验结果表明该实现方法是正确和高效的.  相似文献   

14.
为了克服排序学习算法不能处理包括名词性特征的复杂数据类型的局限性,设计一种新的排序学习算法.在决策树学习算法中,采用新的等级不纯度定义,修改决策树的分裂规则,得到具有直观解释的排序算法,并给出了相关理论基础.实验结果表明:排序树的平均等级损失明显优于感知机类算法和序回归类算法,且具有较快的收敛速度.基于决策树的排序学习算法,可以处理名词性数据和选择相关的特征.  相似文献   

15.
为了解决在企业中实施客户关系管理(CRM),CRM系统中客户行为的定量研究问题,利用决策树的数据挖掘相关技术和方法,提出了UPTree数据挖掘算法,并采用UPTree算法对隐藏在大量客户行为中的信息进行挖掘,从而获取了CRM系统中潜在的客户行为规则,并给出这些行为规则的IF-THEN的描述形式,为企业的科学决策提供依据。  相似文献   

16.
根据淮河某流域连续三年来的水质监测数据,结合用户兴趣度和MID3算法对ID3决策树算法进行改进,并将改进的决策树算法运用于水质评价,建立了淮河某流域水质量评价模型,实现了对水环境质量的评估和决策支持。实验结果表明,改进算法所建立的决策树精确度高、树型结构简单,生成的规则简便、准确,更加符合实际情况,对水环境质量可以作出更为客观、合理的评价,具有一定的实用价值。  相似文献   

17.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

18.
决策树是一种简单而且应用广泛的分类算法。一个决策表中包含大量的样本信息,一个样本就代表一条基本的决策规则。为了从决策表中抽取适应性大的规则,就需要对决策表进行属性约简。使用粗糙集理论对决策表进行约简比较出色。在用辨识矩阵方法对决策表进行属性约简时,需要考虑实现约简的一些技术问题。如建立决策表的可辨识矩阵,对所有取值非空集合元素建立相应的析取逻辑表达式,对析取表达式进行合取运算等。在VB编程环境下,实现了该算法的约简过程。实例仿真表明了该算法对于决策表属性约简是可行的。  相似文献   

19.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号