首页 | 本学科首页   官方微博 | 高级检索  
     检索      

决策树C4.5算法改进与应用
引用本文:陈杰,邬春学.决策树C4.5算法改进与应用[J].教育技术导刊,2018,17(10):88-92.
作者姓名:陈杰  邬春学
作者单位:上海理工大学 光电信息与计算机工程学院,上海 200093
摘    要:针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TM-C4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。

关 键 词:C4.5  TM-C4.5算法  CCP  贝叶斯分类器  剪枝策略  评价标准  
点击此处可从《教育技术导刊》浏览原始摘要信息
点击此处可从《教育技术导刊》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号