首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

2.
石东贤 《科技风》2012,(2):277-278
旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。  相似文献   

3.
决策树分类算法研究综述   总被引:4,自引:0,他引:4  
本文基于决策树分类算法的研究现状,重点介绍了一些极具代表性的算法,包括ID3、C4.5等,对各种决策树分类算法的基本思想进行阐述,分析比较各种典型算法的优点和不足,并对决策树分类算法所面临的问题进行了简要的阐述,为数据分类研究者提供借鉴。  相似文献   

4.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

5.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

6.
针对标准ID3算法在数据规则挖掘的应用中还存在运算时间长、规则挖掘效果不好等问题。本文提出了一种基于属性增益优化ID3算法的体育训练数据规则挖掘模型,首先利用凸函数的性质来改进信息量公式,通过对数据集中属性选择标准的改变从而降低决策树的计算成本,减少决策树的生成时间,之后计算取值较多且不重要的属性信息时,将经验知识度参数引入从而避免取值少的属性被抛弃。此后又进行了专门的仿真实验,实验结果表明,与传统的算法相比,本文设计的经过改进的ID3算法在建树时间和规则数目这两个方面都具有更好的性能。  相似文献   

7.
讨论了基于互信息的决策树分类算法——ID3算法。  相似文献   

8.
李宏林 《情报探索》2011,(11):28-30
应用数据挖掘决策树方法的ID3算法分析高校学生学习成绩,可以形成相应科目的判定规则,进而挖掘科目间的关联性,并比较其重要程度.将成绩离散化是应用ID3算法的前提,选用合适的分类点(如取科目平均值及各科总平均值作为分类点)构建离散区间可以构造出判定效果较好的决策树.  相似文献   

9.
决策树算法是数据挖掘技术中常用的方法,在分类和预测方面有着广泛的应用。本文简要地介绍了决策树ID3算法的基本思想,通过数据实例说明了构造决策树的实现过程,实现了对学生成绩的预测。  相似文献   

10.
ID3算法是决策树分类算法中一种重要方法而被广泛应用,但它存在一些缺点,如生成的树过于繁茂,分枝蕴含的信息量过小等。为了解决这些问题,本文提出了一种改进ID3算法,引入用户兴趣度,并通过试验对改进前后的算法进行了比较。  相似文献   

11.
决策树分类方法在数据挖掘和机器学习中占据很重要的位置,为了应对数据量不断增长的情况,传统的决策树分类算法需要通过模糊计算来解决多模态多维度的数据处理,对经典的ID3算法进行了介绍并给出了其模糊化处理的办法。  相似文献   

12.
决策树是一种有效的数据分类方法。粗糙集理论把知识和分类紧密联系起来,为处理不精确、不完全数据的分类问题提供了一种更符合人类认知的数学工具。提出了把后继节点的变精度加权平均粗糙度和值作为属性选择标准构造决策树的改进新算法。新算法用变精度代替近似精度,能有效地克服噪声数据在构造决策树过程中对刻画精度的影响,使生成的决策树复杂性降低,泛化能力更强。  相似文献   

13.
以当前高职商务英语实践教学中人才与实际需求无法对接、培养目标模糊、校企合作不够深以及教学制度不规范等问题为着眼点,设计了一种以改进ID3决策树为基础的高职商务英语时间教学成效评价模型,并以ID3决策树算法为基础,优化了数据集的属性选择和信息增益。站门的仿真实验结果表明,本文设计的改进算法在很大程度上降低了元算法的运算开销。之后又借助改进模型对某高职院校进行了评定,以实例评定结果为依据进行了改进策略的设计,包括实践教学目标体系、实践教学内容体系、实践教学管理和评价体系等等。  相似文献   

14.
对ID3算法的基本理论和原理进行详细阐述,并利用Weka成功地实现了ID3一级决策树算法。其实现过程和结果对于在不同领域ID3算法的建立及实现具有重要参考意义和依据。  相似文献   

15.
刘平兰 《情报杂志》2004,23(3):45-47
介绍了一种基于机器学习的手写汉字识别方法。针对写汉字的特点,选择并提取了横竖笔划特征、用边特征、结构划分特征、分区特征点、黑点重量等作为分类特征。在分类策略中采取了先粗分类后细分类的多级分类方法.并将决策树算法ID3成功地应用到分类策略中,在识别中利用决策树引导特征提取。减少了特征提取的数量,从而大大提高了识别速度。  相似文献   

16.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

17.
决策树是一种以信息论为基础,直观、高效的分类器.概括了决策树分类法的概念,介绍和对比了传统的ID3和C4.5算法,并就算法的发展趋势进行了归纳.最后,结合遥感图像处理过程分析和总结了决策树分类法的实现过程和应用现状.  相似文献   

18.
介绍了数据挖掘与决策树算法的一些基本概念,然后对最经典也得到最广泛应用的ID3算法及其改进算法作了详细介绍,在最后给出了该算法的一些数据结构和实现代码。  相似文献   

19.
运用ID3算法建立学生借阅图书与学习成绩的分析决策树,并从中提取出一些重要的规则.  相似文献   

20.
决策树方法因其简单、直观、准确率高等特点在数据挖掘及数据分析中得到了广泛的应用。介绍了决策树中最基本的算法——ID3算法的一般知识后,根据实例深入分析了该算法的设计思想、程序实现及优缺点,并针对其缺点进行改进。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号