共查询到18条相似文献,搜索用时 179 毫秒
1.
决策树是一种重要的分类方法.本文分析了单变量决策树和多变量决策树的不足,提出一种基于核属性的决策树构造算法,该算法根据核属性存在的不同情况,选择结点的分裂属性.所创建的决策树规模适中,导出的规则简洁、支持度高.实验结果分析表明,该方法是有效的。 相似文献
2.
吴学辉 《廊坊师范学院学报(自然科学版)》2013,13(3)
将数据挖掘中的决策树与粗糙集理论进行了有机结合,提出了一种基于粗糙集技术的决策树构造算法.该算法通过将计算属性相对于划分的重要度作为选择扩展属性根结点的标准,递归地生成决策树,可以克服ID3算法偏向于选择取值较多的属性的不足. 相似文献
3.
ID3算法是示例学习中建立决策树的一种重要的方法.介绍了ID3决策树算法的基本思想,讨论了 ID3决策树算法中的难点和不足,结合实例给出了利用信息增益度法来改进ID3算法的详细过程. 相似文献
4.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。 相似文献
5.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。 相似文献
6.
张志强 《顺德职业技术学院学报》2007,5(4):39-41
该文提出一种基于决策树的分类挖掘技术,在论述分类挖掘的基础上分析决策树分类挖掘系统的建立思想、步骤及算法,并把该系统应用到优化学生资源管理的实验中,实验结果证明了该方法的可行性。 相似文献
7.
针对双线性插值算法在图像放大过程中处理图像边缘部分的不足,提出了一种新的改进算法。该算法通过分析图像的局部结构对图像分别进行插值。同质区域采用双线性插值算法,边缘区域采用基于圆形孔径的方法进行放大。此外,通过与传统算法进行比较,利用实例说明了该算法在图像处理细节部分的优越性。 相似文献
8.
9.
10.
一种代价敏感学习方法在电信业流失预测中的应用 总被引:1,自引:0,他引:1
根据已有的流失预测方法,提出新的流失预测方法解决数据挖掘中的非对称错分代价问题.该方法以传统C4.5决策树算法为基准分类器,融合代价调整方法实现代价敏感学习.相比之下,C4.5决策树算法仅是基于样本错分代价相同假定,建立了一种错分率最低而非总错分代价最低的预测模型.基于某电信企业的客户数据,及流失客户和非流失客户代价非对称的实际,实证研究结果表明,CS-C4.5通过调整流失类和非流失类样本的比例,大大降低了传统分类算法的样本错分总代价.该方法对于提高电信企业的核心竞争力具有重要的现实意义. 相似文献
11.
决策树是数据挖掘中的一种重要分类方法.在此以粗糙集理论中的正域为启发式函数,设计了一种新的、有效的决策树构造方法.该算法具有较大的灵活性.能从测试属性空间逐次删除已使用过的属性.避免对这些属性进行重复测试,减少测试空间,降低了树的复杂性,从而提高了分类效率.最后,实例验证了算法的可行性与有效性. 相似文献
12.
判定树归纳基本算法是判定树生成的核心算法,有着广泛的应用。针对判定树归纳算法容易出现局部最优化,即早熟现象这一缺陷,运用平均信息增益的方法对该算法进行了改进,把平均信息增益最大的值作为选择测试属性的标准,仿真试验也表明了改进后算法的优越性。 相似文献
13.
医学数据通常属性较多,这在很大程度上限制了信息系统对医疗数据的挖掘效率。通过分析粗糙集正域的相关思想,结合医学领域数据的特点,提出一种基于粗糙集正域的医疗决策表约简算法,并将其应用在医学诊断中。通过实例验证了该算法在医疗决策表约简中的正确性和有效性,具有一定的实用价值。 相似文献
14.
15.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。 相似文献
16.
以南京南部高淳县为研究区,采用2010年ETM+多光谱遥感影像作为遥感信息源,选择影像的地形因素、植被指数(NDVI)作为辅助分类特征,基于改进CRUISE算法构建决策树,实现了研究区的地物分类,并与其他分类方法的结果相比较。实验结果表明,与普通的决策树分类相比,基于改进CRUISE算法的分类可以有效地提高土地分类结果精度,具有良好的适用性。 相似文献
17.
马伟杰 《河南广播电视大学学报》2012,(3):108-110
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。 相似文献