首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
车辆加速性能是衡量驾驶员对车辆驾驶舒适性的一个标准。传统的车辆加速性能是通过判断加速踏板开度衡量的,加速踏板出厂时设置为不能自动调整。采用改进的C4.5算法对车辆加速性能分类,实现自动调整加速踏板开度。首先通过泰勒中值定理对C4.5算法进行简化,然后对车联网数据进行特征提取,生成判断加速性能的决策树分类规则,测试特征提取的并行化运行效率。通过特征提取后的数据集验证了改进的C4.5算法效率和准确率。测试结果表明,改进算法在不降低分类准确率的前提下,有效提高了分类效率。  相似文献   

2.
为了提高C4.5决策树算法的有效性,提出一种改进的C4.5决策树算法。结合粗糙集理论的属性约简算法和Fayyad边界点判定定理,对C4.5算法进行了改进,利用UCI数据集进行了实验。结果表明,改进的C4.5算法不仅提高了准确率,而且缩小了决策树规模,减少了分类时间。  相似文献   

3.
文章主要采用数据挖掘技术中的决策树C4.5算法,对本校学生成绩中的大量数据进行处理,从中选取决策属性,构造决策树,并提取分类规则,从而获取不同类型的学生与成绩之间的关系.试验结果表明,C4.5算法能够将数据进行准确分类和预测,最终得到有价值的结论,供教师决策分析.  相似文献   

4.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

5.
历年学生就业积累的大量数据信息,运用数据挖掘算法中的C4.5决策树算法对所给数据进行分类和预测。通过实例给出了该算法在高职高专就业工作中的应用,找出影响学生就业的主要因素。  相似文献   

6.
一种代价敏感学习方法在电信业流失预测中的应用   总被引:1,自引:0,他引:1  
根据已有的流失预测方法,提出新的流失预测方法解决数据挖掘中的非对称错分代价问题.该方法以传统C4.5决策树算法为基准分类器,融合代价调整方法实现代价敏感学习.相比之下,C4.5决策树算法仅是基于样本错分代价相同假定,建立了一种错分率最低而非总错分代价最低的预测模型.基于某电信企业的客户数据,及流失客户和非流失客户代价非对称的实际,实证研究结果表明,CS-C4.5通过调整流失类和非流失类样本的比例,大大降低了传统分类算法的样本错分总代价.该方法对于提高电信企业的核心竞争力具有重要的现实意义.  相似文献   

7.
大数据时代,数据量呈现爆炸式增长,且在内容与形式上日益复杂化,造成数据质量下降、数据丢失等,即产生不完备数据。提出一种改进的C4.5算法,使其能更好地处理不完备数据。每次特征选择前对本次特征选择的数据子集使用子集匹配方法进行处理,通过比较数据清洗方法与子集匹配方法的结果,显示即便是在相同清洗规则下,子集匹配方法在算法分类准确率上也更有优势。实验结果证明,在利用C4.5算法进行特征选择时,在该数据子集上对不完备数据进行处理,可以得到较高的分类准确率,同时得到比数据清洗高的时间复杂度。  相似文献   

8.
运用开源系统WEKA,选取C4.5算法构建贫困生决策树模型,利用30%的数据来测试模型分类效果,实验结果显示,模型预测的准确率和精确度都较高,模型分类效果较好。从模型构建中发现了影响贫困生分类的重要标准和评价规则,从而为完善贫困生评价体系并改进评价工作提供有效建议。  相似文献   

9.
针对目前高校计算机等级考试持续过低的现状,应用决策树C4.5算法对安徽警官职业学院计算机等级考试成绩数据进行深入分析和研究,对预处理后的数据进行挖掘并建立决策树分类模型,由决策树产生分类规则,找出影响计算机等级成绩潜在的主导因素,从而为进一步提高高校计算机等级考试通过率提供参考依据.  相似文献   

10.
以现有的数据挖掘决策树算法作为理论支撑,从就业数据出发,按照数据挖掘的基本步骤和方法,执行C4.5决策树算法对数据进行分类和预测,从积累的大量数据中得到以就业类别为属性的分类规则,以此为学校领导机构提供决策支持,提高就业水平,对就业指导工作具有一定的现实意义。  相似文献   

11.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。  相似文献   

12.
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TM-C4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。  相似文献   

13.
混合生产过程是一类典型的混杂系统,难以用准确的数学解析式来实现生产过程的优化与控制。提出了基于C4.5算法的混合生产过程优化与控制方法。首先利用混合整数线性规划求解混合生产过程最大值的数据集,然后采用C4.5决策树算法挖掘混合生产过程参数与最大生产值之间的关联规则,最后利用关联规则实现混合生产过程的优化与控制。实验结果表明了该方法的有效性。  相似文献   

14.
介绍了一种一般情况下的C4.5数据挖掘算法的优化方法。原来的C4.5算法在计算属性信息增益率时需要大量用到对数运算,而优化后的C4.5算法计算属性信息增益率时只需用到加减乘除运算,在实现时不用频繁调用对数函数,优化后的算法不会改变属性信息增益率的排序,不改变生成的决策树。改进后的算法能做到在不改变准确率和不增加空间复杂度的情况下,减少时间复杂度,提高了决策树生成效率。  相似文献   

15.
企业在经营活动中经常需要根据以往经营的数据来预测客户数量,但数据的规模往往非常巨大,难以通过人力来进行分析.所以必须利用计算机,通过数据挖掘的方法来进行分析.C4.5决策树算法是一种流行的用于数据挖掘的方法,可以快速准确地将数据分类.  相似文献   

16.
提出了一种分类规则的蚁群挖掘算法.算法首先对所有的连续属性值离散化,得到相应的离散属性,然后让各只蚂蚁按照某种策略选择相关属性,对所选属性再选择理想的属性值,循环地构造单个规则,接着更新训练集,最终形成各类规则集.最后用新规则约简算法进行约简操作.对两个公用数据的实验及其与Ant-Miner和C4.5的对比表明,算法能够发现更好的分类规则.实验同时表明该算法是有效的.  相似文献   

17.
本文利用决策树算法对保险业务数据进行了客户风险分析,并以重大疾病险种的索赔业务数据为基础,详细介绍了数据预处理过程,针对年龄、地域、收入因素,给出了基于C4.5算法的客户风险分析建模过程。  相似文献   

18.
嵌入式网络数据库优化访问的关键是对访问目标数据的准确推荐和挖掘,以实现数据的准确检索。提出一种基于模糊C均值聚类的嵌入式数据库并行推荐算法,构建嵌入式数据的数据结构模型,进行数据信息流属性集特征提取。采用模糊C均值聚类算法实现属性分类,以此实现嵌入式数据的库并行推荐和挖掘。仿真结果表明,采用该算法进行数据库访问,精度较高,执行时间较短,性能优越。  相似文献   

19.
通过C4.5算法分析学生成绩,给出学生成绩数据挖掘的模型,实验结果证明该算法能够正确地给学生成绩分类,并能得到有价值的归纳结论,供教学管理者决策分析.  相似文献   

20.
针对国内高职学生首次职业类型选择状况进行了研究,介绍了数据挖掘、决策树、C4.5算法,对高职学生职业类型选择数据进行预处理,应用 C4.5算法构造高职学生首次职业类型选择决策树并使用事后修剪法对其进行了修剪,从中抽取出高职学生首次职业类型选择与大学阶段习得的德、体、智、能和专五个方面能力之间的潜在规则并对其做了验证分析,挖掘出的规则为高职学生首次职业类型选择进行动态预测并对其就业提供指导。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号