首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
车辆加速性能是衡量驾驶员对车辆驾驶舒适性的一个标准。传统的车辆加速性能是通过判断加速踏板开度衡量的,加速踏板出厂时设置为不能自动调整。采用改进的C4.5算法对车辆加速性能分类,实现自动调整加速踏板开度。首先通过泰勒中值定理对C4.5算法进行简化,然后对车联网数据进行特征提取,生成判断加速性能的决策树分类规则,测试特征提取的并行化运行效率。通过特征提取后的数据集验证了改进的C4.5算法效率和准确率。测试结果表明,改进算法在不降低分类准确率的前提下,有效提高了分类效率。  相似文献   

2.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

3.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

4.
谢秋华 《三明学院学报》2012,29(4):34-39,100
介绍了一种C4.5算法的改进方法,即在计算属性信息增益率时只用到加减乘除运算,而不是像C4.5那样的大量用到对数运算。实验表明,改进的C4.5算法在不改变模型预测准确率的同时,减少了计算时间,提高了决策树的生成效率,而后将改进的C4.5算法作用于《大学计算机基础》课程的成绩分析,得到的分析结果用于辅助指导教师对《大学计算机基础》课程的教学工作,能够更好地促进教学,提高学生对此门课程的掌握程度和为普及计算机做出帮助。  相似文献   

5.
文章主要采用数据挖掘技术中的决策树C4.5算法,对本校学生成绩中的大量数据进行处理,从中选取决策属性,构造决策树,并提取分类规则,从而获取不同类型的学生与成绩之间的关系.试验结果表明,C4.5算法能够将数据进行准确分类和预测,最终得到有价值的结论,供教师决策分析.  相似文献   

6.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

7.
一种代价敏感学习方法在电信业流失预测中的应用   总被引:1,自引:0,他引:1  
根据已有的流失预测方法,提出新的流失预测方法解决数据挖掘中的非对称错分代价问题.该方法以传统C4.5决策树算法为基准分类器,融合代价调整方法实现代价敏感学习.相比之下,C4.5决策树算法仅是基于样本错分代价相同假定,建立了一种错分率最低而非总错分代价最低的预测模型.基于某电信企业的客户数据,及流失客户和非流失客户代价非对称的实际,实证研究结果表明,CS-C4.5通过调整流失类和非流失类样本的比例,大大降低了传统分类算法的样本错分总代价.该方法对于提高电信企业的核心竞争力具有重要的现实意义.  相似文献   

8.
分类技术中的决策树算法分析   总被引:6,自引:0,他引:6  
介绍了解决分类问题的常用方法——决策树。并对决策树的原理及Quinlan的ID3、C4.5两种主要的决策树算法进行了分析。通过分析它们的基本原理以及主要特点,提出了对决策树算法改进的展望。  相似文献   

9.
以现有的数据挖掘决策树算法作为理论支撑,从就业数据出发,按照数据挖掘的基本步骤和方法,执行C4.5决策树算法对数据进行分类和预测,从积累的大量数据中得到以就业类别为属性的分类规则,以此为学校领导机构提供决策支持,提高就业水平,对就业指导工作具有一定的现实意义。  相似文献   

10.
高校信息系统经过多年运行,积累了海量综合反映学生各方面学习特征的数据,充分利用这些信息将极大改进教学工作。但从这些海量数据中提取出规律性的信息并指导教学工作,却是信息系统使用的瓶颈。文本提出了采用C4.5决策树这一数据挖掘领域的重要算法,为海量数据提取提供了一条行之有效的途径。  相似文献   

11.
介绍了一种一般情况下的C4.5数据挖掘算法的优化方法。原来的C4.5算法在计算属性信息增益率时需要大量用到对数运算,而优化后的C4.5算法计算属性信息增益率时只需用到加减乘除运算,在实现时不用频繁调用对数函数,优化后的算法不会改变属性信息增益率的排序,不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下,减少时间复杂度,提高了决策树生成效率。  相似文献   

12.
C4.5 算法是数据分类的经典数据挖掘算法。整合并规范了临床确诊病例中的糖尿病并发症数据,同时进行了粗糙集约简,并运用C4.5算法实现了分类。研究表明,该方法能很好地实现决策分类,以辅助临床诊断。  相似文献   

13.
针对国内高职学生首次职业类型选择状况进行了研究,介绍了数据挖掘、决策树、C4.5算法,对高职学生职业类型选择数据进行预处理,应用 C4.5算法构造高职学生首次职业类型选择决策树并使用事后修剪法对其进行了修剪,从中抽取出高职学生首次职业类型选择与大学阶段习得的德、体、智、能和专五个方面能力之间的潜在规则并对其做了验证分析,挖掘出的规则为高职学生首次职业类型选择进行动态预测并对其就业提供指导。  相似文献   

14.
大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处理,通过比较数据清洗方法与子集匹配方法的结果,显示即便是在相同清洗规则下,子集匹配方法在算法分类准确率上也更有优势。实验结果证明,在利用C4.5算法进行特征选择时,在该数据子集上对不完备数据进行处理,可以得到较高的分类准确率,同时得到比数据清洗高的时间复杂度。  相似文献   

15.
通过C4.5算法分析学生成绩,给出学生成绩数据挖掘的模型,实验结果证明该算法能够正确地给学生成绩分类,并能得到有价值的归纳结论,供教学管理者决策分析.  相似文献   

16.
混合生产过程是一类典型的混杂系统,难以用准确的数学解析式来实现生产过程的优化与控制。提出了基于C4.5算法的混合生产过程优化与控制方法。首先利用混合整数线性规划求解混合生产过程最大值的数据集,然后采用C4.5决策树算法挖掘混合生产过程参数与最大生产值之间的关联规则,最后利用关联规则实现混合生产过程的优化与控制。实验结果表明了该方法的有效性。  相似文献   

17.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

18.
本文采用C4.5算法构造决策树的方法,对学生的成绩进行分析并找出影响成绩的主要因素和规则,给教师调整教学环节提供参考,对学生管理工作提出意见,从而指导教育教学工作。  相似文献   

19.
历年学生就业积累的大量数据信息,运用数据挖掘算法中的C4.5决策树算法对所给数据进行分类和预测。通过实例给出了该算法在高职高专就业工作中的应用,找出影响学生就业的主要因素。  相似文献   

20.
针对现有决策树中ID3算法倾向于取值较多的属性的缺点,提出一种利用优化法的思想来改进信患增益的算法。用ID3算法及改进后的算法建立金融企业决策树分类模型,利用某银行提供的客户信息和银行业务信息等数据,通过客户存款情况,探讨对金融客户进行分类,研究忠实客户的特征。实验中两个方案的比较表明,利用优化法算法来选择决策树分支取值,不但可以加快决策树的生长,而且最重要的是可以得到结构好的决策树,便于从中挖掘好的规则信息。特别是在使用决策树算法来挖掘的数据越多,算法的效率和性能就越好,算法的优越性就越明显。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号