首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 140 毫秒
1.
本文根据决策树分类技术对福建省计算机等级考试中的成绩进行分析和挖掘.首先对成绩数据进行离散化处理,设置成决策树分类的属性数据;接着利用ID3改进算法构建成绩分类的决策树模型,并对其剪枝;最后根据模型给出相应的规则和几个教学建议.实验结果表明,利用决策树分类技术在计算机等级考试中进行挖掘分析的方法是有效可行的.  相似文献   

2.
文章主要采用数据挖掘技术中的决策树C4.5算法,对本校学生成绩中的大量数据进行处理,从中选取决策属性,构造决策树,并提取分类规则,从而获取不同类型的学生与成绩之间的关系.试验结果表明,C4.5算法能够将数据进行准确分类和预测,最终得到有价值的结论,供教师决策分析.  相似文献   

3.
经典决策树算法不能处理树构建和分类过程中的不确定数据,针对这一局限,提出基于概率分布的方法,把决策树分类技术扩展到含有不确定数据的环境中。然后,针对软件外包评价中普遍存在着不确定数据,应用决策树分类方法,对软件外包公司进行客观评价。实验表明,本文提出的基于不确定数据的决策树分类算法能够实现对软件外包评价的定量研究。  相似文献   

4.
刘冲  杨磊  李娜 《教育技术导刊》2016,15(12):33-34
分类是数据挖掘的一个重要课题。分类的目的是建立一个分类模型,该模型能把数据库中的数据项映射到给定类别中的某一个利用该模型形成分类规则并预测未来数据趋势。决策树归纳是经典的分类算法,构建决策树模型算法中最有影响力的方法是ID3算法。针对ID3算法缺点,使用预剪枝和后剪枝相结合的办法处理决策树中的过学习情况,可生成一个更简单、更精确的决策树。  相似文献   

5.
决策树是归纳学习和数据挖掘的重要方法,通常用来形成分类器和预测模型。对网络课程知识点个性化设计中的大量数据,运用数据挖掘算法中的决策树C4.5算法对所给数据进行处理,选取决策属性,构造决策树,提取分类规则,获取每一个知识点与不同类型的学生之间的关系。通过实验仿真发现,C4.5决策树算法取得了较为理想的分类预测效果。  相似文献   

6.
分层教学是在充分考虑学生具体情况的前提下,将水平相近的学生分为一组,实现针对性的个性化教学,数据挖掘技术中的决策树归纳分类所需的训练数据少,便于理解和解释,可视性强,分类规则形成简便,可以科学准确将学生进行分层。通过详细讨论决策树归纳分类的过程和决策树的构建,选取部分学生样本进行决策树的生成及分类规则的提取,为数据挖掘分类技术在分层教学中的应用提供了思路和途径。  相似文献   

7.
王琴竹 《运城学院学报》2011,29(2):53-54,57
决策树算法广泛应用于模式识别和机器学习等领域,用来解决与分类相关的问题。决策树算法中的过度拟合会在很大程度上影响到最终的分类结果。针对过度拟合产生的原因,采用悲观错误剪枝方法,对学生成绩决策数据进行分析,得出影响学生成绩的重要因素。实验表明,该方法可以得到尽可能短的分类规则,有效地提高了决策树的性能。  相似文献   

8.
基于ID3算法的企业产品安全库存量预测   总被引:1,自引:0,他引:1  
通过构建企业数据仓库,对数据仓库中的数据进行归约预处理后, 得到训练样本集, 采用ID3 算法建立一棵企业客户购买力分类决策树, 通过对企业客户购买力的分析,科学地预测企业产品的安全库存量.  相似文献   

9.
针对目前高校计算机等级考试持续过低的现状,应用决策树C4.5算法对安徽警官职业学院计算机等级考试成绩数据进行深入分析和研究,对预处理后的数据进行挖掘并建立决策树分类模型,由决策树产生分类规则,找出影响计算机等级成绩潜在的主导因素,从而为进一步提高高校计算机等级考试通过率提供参考依据.  相似文献   

10.
决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。  相似文献   

11.
为了进一步提高决策树模型的交通事件检测性能,且避免噪音和过拟合现象,提出了基于随机森林的交通事件检测方法.从分类强度和相关性2个角度进行分析,并构建了3组实验:与不同数目决策树的对比、与不同决策树的对比及与神经网络的对比.实验数据采用实测的高速公路交通参数数据库(I-880数据库);实验的评价指标采用检测率、误警率、平均检测时间、分类率和ROC曲线下的面积.实验结果表明,基于随机森林的交通事件检测模型可以提高检测率、减少检测时间、提高分类正确率,和多层前馈神经网络相比具有很好的竞争力.  相似文献   

12.
决策树通过对获取的样本数据属性使用信息论知识原理进行解析和归纳,最终形成类似于流程图的树型结构形式。ID3算法是典型采用贪心算法的归纳学习算法,其使用递归方式采用贪心算法来生成决策树。与其他分类技术算法比较,ID3算法有着自己的优势,但在实际应用中,采用决策树ID3算法进行分类时,需要先对数据进行一些处理或改进。  相似文献   

13.
根据淮河某流域连续三年来的水质监测数据,结合用户兴趣度和MID3算法对ID3决策树算法进行改进,并将改进的决策树算法运用于水质评价,建立了淮河某流域水质量评价模型,实现了对水环境质量的评估和决策支持。实验结果表明,改进算法所建立的决策树精确度高、树型结构简单,生成的规则简便、准确,更加符合实际情况,对水环境质量可以作出更为客观、合理的评价,具有一定的实用价值。  相似文献   

14.
为了克服排序学习算法不能处理包括名词性特征的复杂数据类型的局限性,设计一种新的排序学习算法.在决策树学习算法中,采用新的等级不纯度定义,修改决策树的分裂规则,得到具有直观解释的排序算法,并给出了相关理论基础.实验结果表明:排序树的平均等级损失明显优于感知机类算法和序回归类算法,且具有较快的收敛速度.基于决策树的排序学习算法,可以处理名词性数据和选择相关的特征.  相似文献   

15.
在音频检测技术研究的基础上,设计了交通事故自动报警系统,此系统根据车辆的声强和声谱等特性,通过多特征碰撞声检测算法检测是否发生了碰撞型交通事故。文章对多特征碰撞声检测算法以及碰撞声信号时域的能量分布特征进行了分析,验证了多特征碰撞声检测算法的高精度和可靠性。该研究可为实现交通事故的快速救援、降低事故中因抢救延迟造成的死亡率等提供技术支持。  相似文献   

16.
决策树算法在客户分类中的应用   总被引:1,自引:0,他引:1  
介绍了数据挖掘的概念及决策树的ID3算法,利用该算法对租赁公司的客户进行分类,给出了分类步骤发现了申请或不申请租赁的客户类型特征,从而为公司租赁业务制定最佳指导策略。  相似文献   

17.
为了改善传统ID3算法在分类属性选择上存在多值偏向性的不足,提出基于PCA的决策树优化算法。在普通基于PCA 的决策树改进算法中,存在数据经降维处理后代表性不强的问题,导致算法需经过多次数据运行后,准确率才能小幅提升。在ID3算法基础上,在分类前两次提取属性特征值,并计算了需要分类的数据量,也即对原始数据进行最重要的属性选择。在子树建立之后,再进行数据的降维合并选择。采用UCI数据库中的3个数据集对改进算法进行验证,结果表明改进算法的平均准确率达到94.6%,相比传统ID3算法与普通PCA决策树优化算法分别提升了1.6%和0.6%。因此,基于PCA的决策树算法能在一定程度上提升结果准确率,具备一定的应用价值。  相似文献   

18.
针对国内高职学生首次职业类型选择状况进行了研究,介绍了数据挖掘、决策树、C4.5算法,对高职学生职业类型选择数据进行预处理,应用 C4.5算法构造高职学生首次职业类型选择决策树并使用事后修剪法对其进行了修剪,从中抽取出高职学生首次职业类型选择与大学阶段习得的德、体、智、能和专五个方面能力之间的潜在规则并对其做了验证分析,挖掘出的规则为高职学生首次职业类型选择进行动态预测并对其就业提供指导。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号