首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
通过分析选择决策树作为保险业客户流失预测模型实现的手段,给出了决策树实现流失预测的算法设计,通过流程图及相应数据结构的说明,介绍了算法实现要点,最后的实验结果表明所建立的预测模型具有良好的准确率。  相似文献   

2.
崔丽 《科技通报》2013,29(2):45-47
在医疗系统中,人们通常使用决策树对患者的发病类型以及概率进行有效地分类预测.随着信息技术的普及,医疗系统中产生了大量的历史医疗记录,处理和分析这些海量的医疗数据给医疗系统带来了极大地挑战.本文针对海量医疗数据问题,提出了分布式构建决策树算法.该算法分布式逐层构建决策树,可以高效地构建决策树,快速有效地完成医疗系统中的预测工作.该算法是基于现有流行的云计算平台,使用MapReduce分布式框架设计的分布式算法.实验结果表明,该算法具有很好的扩展性和高效性.  相似文献   

3.
ID3决策树算法是数据挖掘中最常用的一种方法,但其存在多值偏向性等问题,文中根据相似性原理,引进属性趋近度概念,以描述属性和决策分类属性的分类样本数的趋近程度确定测试属性,构建决策树,并对ID3算法和改进算法T_ID3算法的多值偏向性问题和测试预测率进行了理论和实验的验证。  相似文献   

4.
针对银行CRM中的海量客户历史数据问题,本文采用决策树算法和BP神经网络算法,选取部分客户业务数据分别进行分类预测实验,实验结果表明利用上述算法可以较好地解决银行中对客户分类预测的需求。  相似文献   

5.
决策树是一种以信息论为基础,直观、高效的分类器.概括了决策树分类法的概念,介绍和对比了传统的ID3和C4.5算法,并就算法的发展趋势进行了归纳.最后,结合遥感图像处理过程分析和总结了决策树分类法的实现过程和应用现状.  相似文献   

6.
石东贤 《科技风》2012,(2):277-278
旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。  相似文献   

7.
《科技风》2020,(5)
网络是把双刃剑,对学生来说有利也有弊。为了制定合理的管理措施,督促大学生及时规范自己的网络行为。该研究重点研究了数据挖掘算法的选择,最后选择决策树、关联规则、预测分析对学生上网行为中的重要数据进行挖掘,实现大数据网络行为属性与学生学习成绩之间相关属性分析。结果显示,在"流量数据"中,"上网时间长度长"无疑是导致在校学生正常学习水平差的罪魁祸首。研究结果:相当差的算法是逻辑关联回归,相对比逻辑回归好一点的是决策树挖掘算法,最优秀的数逻辑关联性和规则数据挖掘算法。  相似文献   

8.
剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。  相似文献   

9.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

10.
介绍了数据挖掘与决策树算法的一些基本概念,然后对最经典也得到最广泛应用的ID3算法及其改进算法作了详细介绍,在最后给出了该算法的一些数据结构和实现代码。  相似文献   

11.
为了优化企业商品销售决策方案,提高商品销售预测的准确率,采用数据挖掘的方法对商品销售预测分析。首先对商品销售预测基本流程和现有预测算法进行归纳总结,接着提出了基于数据挖掘的商品销售预测框架,并对决策树及贝叶斯网络算法数学模型、关联规则进行阐述,最后运用实例仿真,对商品的一季度的销售额与利润额进行预测分析,实验表明,预测数据与实际数据基本一致,预测效果良好,具有一定的研究价值。  相似文献   

12.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

13.
研究基于云计算的个人信用数据分析方法,建立个人信用评价模型。个人信用数据具有数据类型多、数据关系复杂且数据量大的特点,采用传统的方法进行个人信用数据分析,不但计算过程较为复杂、效率低下,且对个人信用状况的预测准确度较低,效果不尽人意。为此,提出基于决策树算法的个人信用数据分析方法。针对初始数据存在的噪声、属性值空缺及数据类型不统一的问题,分别对原始数据进行数据去噪、空缺值填补及数据归一化等预处理,依据相关理论生成个人信用数据分类决策树,并对相关节点属性进行选择,实现个人信用数据分析模型的构建,从而对个人的信用状况作出正确预测。实验结果表明,基于决策树的个人信用数据分析模型,能够节省数据处理时间,较为准确的搜索到关键数据,提高了分析模型的可信度与稳健性,效果令人满意。  相似文献   

14.
对ID3算法的基本理论和原理进行详细阐述,并利用Weka成功地实现了ID3一级决策树算法。其实现过程和结果对于在不同领域ID3算法的建立及实现具有重要参考意义和依据。  相似文献   

15.
尝试将数据挖掘算法应用于降水相态判别,将2010-2014年冬季降雪过程中103个样本,抽象成雪(yes),雨(no)的二元分类问题。选取被认为可能对相态变化较为重要的500 h Pa和1000 h Pa厚度差、零度层高度,暖层厚度,云顶温度,925 h Pa温度等11个因子。借助数据挖掘的C5.0决策树算法和随机森林算法,构建模型。采用十折交叉验证评估模型性能,表明两种方法预测结果均较准确,其中随机森林算法表现更优,且对不同数据预测效果都较为稳定。决策树算法所用的因子信息较少,得到的准确率相对较低。随机森林算法可以使每个变量得到充分训练,判断准确率明显提高。  相似文献   

16.
决策树算法是数据挖掘中一个重要的内容,但是在实际应用过程中,现存的多种决策树算法也存在着很多不足之处。本文总结并分析了近年来数据挖掘技术在决策树算法方面的研究,探讨了进一步的研究发展方向。  相似文献   

17.
根据配网变压器历史重过载记录,利用泰勒展开式对改进的决策树C4.5算法计算各变量,并对某省的城农网配网变压器构建重过载模型,然后分别进行重过载预测,实验结果表明:改进的C4.5算法和原始的C4.5算法相比,时间复杂度和空间复杂度都明显降低,在预测城农网配变重过载方面有较高的准确率。  相似文献   

18.
决策树分类算法研究综述   总被引:4,自引:0,他引:4  
本文基于决策树分类算法的研究现状,重点介绍了一些极具代表性的算法,包括ID3、C4.5等,对各种决策树分类算法的基本思想进行阐述,分析比较各种典型算法的优点和不足,并对决策树分类算法所面临的问题进行了简要的阐述,为数据分类研究者提供借鉴。  相似文献   

19.
王文誉 《科技风》2014,(10):23-23
本系统基于网站的形式建立一个网络应用,通过用户输入他们的专业兴趣和自身的学术条件,此项网络应用会智能地匹配可能的研究生学校同时将结果以略高于自身学术条件,与自身学术条件相当和低于自身学术条件三类呈现给用户。该网络应用使用的培训数据是从一些已经被某些学校录取的学生手里获得的原始数据,然后使用分析工具Weka来处理并分析这些数据。分析过程中使用了三种数据挖掘方法–决策树算法,朴素贝叶斯算法和临近取样算法来分别建立模型。模型建立成功之后,通过主观和客观的比较方法找到决策树算法是最适合的算法。最后,用C4.5决策树算法来建立模型作为数据挖掘引擎的核心并实现此项网络应用。  相似文献   

20.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号