决策树C4.5算法改进与应用 |
| |
引用本文: | 陈杰,邬春学.决策树C4.5算法改进与应用[J].教育技术导刊,2018,17(10):88-92. |
| |
作者姓名: | 陈杰 邬春学 |
| |
作者单位: | 上海理工大学 光电信息与计算机工程学院,上海 200093 |
| |
摘 要: | 针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TM-C4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。
|
关 键 词: | C4.5 TM-C4.5算法 CCP 贝叶斯分类器 剪枝策略 评价标准 |
|
| 点击此处可从《教育技术导刊》浏览原始摘要信息 |
| 点击此处可从《教育技术导刊》下载免费的PDF全文 |
|