首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 312 毫秒
1.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

2.
针对现有决策树中ID3算法倾向于取值较多的属性的缺点,提出一种利用优化法的思想来改进信患增益的算法。用ID3算法及改进后的算法建立金融企业决策树分类模型,利用某银行提供的客户信息和银行业务信息等数据,通过客户存款情况,探讨对金融客户进行分类,研究忠实客户的特征。实验中两个方案的比较表明,利用优化法算法来选择决策树分支取值,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。特别是在使用决策树算法来挖掘的数据越多,算法的效率和性能就越好,算法的优越性就越明显。  相似文献   

3.
决策树是数据挖掘中重要的分类算法,通常用来形成分类器.ID3算法是决策树中的核心算法.针对ID3算法倾向于取值较多的属性的缺点,引进属性重要度对ID3算法予以改进,并通过实验对改进前后的算法进行了比较.实验表明,改进后的算法是有效的。  相似文献   

4.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

5.
ID3算法是构造决策树的一种经典算法,传统的ID3算法存在很多问题,研究者提出了多种改进算法。简要概述基于粗糙集、粒计算和分类矩阵的ID3改进算法,通过实验分析对比3种改进算法的优势和不足,并对ID3算法的应用前景提出展望。  相似文献   

6.
在科研工作者的科研活动中,发表论文是其中非常重要的部分。论文承载着科研工作者的研究成果,只有发表在出版物上,才能得到世人的认可。现有稿刊推荐研究的推荐结果少,而且推荐结果的准确度不高,投稿人很难从推荐结果中发现适合投稿的期刊。鉴于此,提出利用改进的ID3决策树算法对期刊与稿件相关度进行分类建模,利用得到的分类规则为投稿人推荐合适期刊的方法。实验结果表明,基于ID3决策树改进算法的稿刊推荐方法推荐准确率较高。  相似文献   

7.
一种改进的ID3算法   总被引:2,自引:0,他引:2  
ID3算法是决策树学习的核心算法。本文论述ID3算法的基本思想和实现方法,针对原有算法的不足之处,提出了一种基于属性优先权的新算法,并通过实验证明改进后的算法具有更高的决策效率。  相似文献   

8.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

9.
分析了分类规则挖掘方法中决策树的原理,提出了ID3算法的改进算法,并将优化改进后的算法应用到营销决策支持系统中。  相似文献   

10.
ID3算法是决策树归纳分类算法的一种。通过对ID3算法的计算复杂度分析,提出了利用统计理论知识和条件概率的思想来改进算法,并运用改进算法构造决策树。  相似文献   

11.
针对传统信用评价方法分类精度较低、数据集属性变量间存在相关性等问题,提出基于主成分分析的稀疏贝叶斯学习(PCA-SBL)算法。首先对数据集特征变量进行主成分分析,使降维后的变量无相关性|其次,对主成分分析后的数据进行稀疏贝叶斯分类|最后将 PCA-SBL 分类方法分类精度与传统分类方法精度进行比较。分析发现,在 German Credit Data 和 Australian Credit Data 上,与传统 KNN、朴素贝叶斯、SVM、随机森林、决策树相比,改进的 SBL 算法分类精度平均提高了 5.26%、4.65%、2.11%、2.125%、4.66%,与稀疏贝叶斯学习算法(SBL)相比,平均提高 0.965%,从而证明 PCA-SBL 算法具有更高的分类效果。  相似文献   

12.
决策树ID3算法在学生成绩中的应用   总被引:2,自引:0,他引:2  
介绍了数据挖掘中决策树的分类方法和概念,以及著名的ID3算法,同时也介绍了ID3算法在学生成绩中的应用.  相似文献   

13.
根据淮河某流域连续三年来的水质监测数据,结合用户兴趣度和MID3算法对ID3决策树算法进行改进,并将改进的决策树算法运用于水质评价,建立了淮河某流域水质量评价模型,实现了对水环境质量的评估和决策支持。实验结果表明,改进算法所建立的决策树精确度高、树型结构简单,生成的规则简便、准确,更加符合实际情况,对水环境质量可以作出更为客观、合理的评价,具有一定的实用价值。  相似文献   

14.
为了解决服务器运行过程中由于性能故障造成服务质量下降的问题,提出一种基于决策树的日志分析方法,以服务器日志文件中记录服务器关键性能指标的数据为研究对象,利用决策树中常用的ID3、C4.5和CART 3种算法预测服务器未来性能指标发展趋势。实验结果表明,在实际运行过程中,C4.5算法对服务器性能指标数据预测的准确率和召回率最好,分别达到了92.23%和95.37%,在3种决策树算法中拥有最高的准确率与召回率,且相比传统开发人员从日志文件中寻找故障的方法,准确率提高了20%左右,因此能够更好地预测服务器系统性能指标发展趋势。通过该方法可提前感知系统运行状况,并及时作出调整,从而有效降低实际生产过程中服务器故障发生概率,提高服务质量。  相似文献   

15.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了ID3决策树算法的基本思想,讨论了 ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程.  相似文献   

16.
为了提高脑力负荷分类准确率,提出一种将Bagging和极限学习机相结合的集成算法。用极限学习机(ELM)作为底层弱分类器,通过多数投票方式决定最终类别的标签,从而构建最终强分类器。实验结果表明,在脑力负荷识别研究问题上,该集成算法的分类准确率在4个被试数据集上分别达到了96.17%、96.02%、92.50%和93.50%。相较于传统的ELM算法,分类准确率在4个被试数据集上分别提升了1.59%、1.34%、2.86%和1.80%。并且新算法在精确率、灵敏度和特异度等评估标准上均高于传统ELM分类器。  相似文献   

17.
以南京南部高淳县为研究区,采用2010年ETM+多光谱遥感影像作为遥感信息源,选择影像的地形因素、植被指数(NDVI)作为辅助分类特征,基于改进CRUISE算法构建决策树,实现了研究区的地物分类,并与其他分类方法的结果相比较。实验结果表明,与普通的决策树分类相比,基于改进CRUISE算法的分类可以有效地提高土地分类结果精度,具有良好的适用性。  相似文献   

18.
朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。  相似文献   

19.
K 均值算法(K-Means)是聚类算法中最受欢迎且最健壮的一种算法,然而在实际应用中,存在真实数据集划分的类数无法提前确定及初始聚类中心点随机选择易使聚类结果陷入局部最优解的问题。因此提出一种基于最大距离中位数及误差平方和(SSE)的自适应改进算法。该算法根据计算获取初始聚类中心点,并通过 SSE 变化趋势决定终止聚类或继续簇的分裂,从而自动确定划分的类簇个数。采用 UCI 的 4 种数据集进行实验。结果表明,改进后的算法相比传统聚类算法在不增加迭代次数的情况下,聚类准确率分别提高了17.133%、22.416%、1.545%、0.238%,且聚类结果更加稳定。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号