共查询到20条相似文献,搜索用时 328 毫秒
1.
网路通信中漂移数据抗干扰镇定模型分析 总被引:1,自引:0,他引:1
提出一种基于随机决策树以及自适应门限变换的漂移数据抗干扰镇定模型,把随机决策树融入Hoeffding Bounds不等式检测概念漂移数据并过滤其中的干扰因素,通过自适应门限的抗干扰阀值算法,实时跟踪并抑制相关的干扰因素处理,确保网络通信的顺利运行。实验结果说明,该模型的检测准确率、抗噪性、分类精度都优于传统模型,取得了令人满意的效果。 相似文献
2.
提出一种基于云理论和神经网络构造决策树的文本分类方法。运用云神经网络学习变量间的云映射关系,从中生成云决策树。这种方法结合了神经网络的学习算法和决策树的推理方法,具有神经网络的学习能力,并且应用了云发生器对处理不确定性的能力。更符合人类的思维方式,从而进一步提高了文本分类的效率、准确性和可靠性。 相似文献
3.
4.
本文以辽宁省凌源市为研究对象,采用RS技术,以ETM+数据为信息源,使用ENVI遥感影像处理软件进行数据处理,对凌源市土地利用类型进行分类,并对分类结果进行精度比较分析。分类的方法包括非监督分类,监督分类的最大似然法分类以及决策树分类。采用混淆矩阵法对三种分类结果进行精度分析。结果表明,非监督分类与最大似然法分类的总体精度分别为84.34%、85.82%,精度不高。在决策树分类中,对数据进行地物光谱特征分析、NDVI特征分析、主成分分析并结合DEM数据,建立一棵比较合理的决策树,总体分类精度达到90.65%。 相似文献
5.
6.
剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。 相似文献
7.
8.
随着信息技术的迅猛发展,大型数据库中的数据正在呈几何级数增长,冗余分类技术已经成为信息组织的重要手段。在总结归纳已有的冗余分类算法弊端的基础上,参考决策树算法提出了一种新的基于数据库抽样的海量数据冗余分类算法。算法引入宽度优先扩展思路,并给出了算法的基本思想和具体实现过程,探讨了并行环境下进行计算的优化步骤。在与SPRINT算法的比较实验中,新算法展现了良好的性能和分类效率。 相似文献
9.
10.
一种改进的SVM决策树文本分类算法 总被引:1,自引:0,他引:1
将SVM和二叉决策树结合起来构成SVM决策树的方法能够较好地解决多类文本分类问题,在此基础上引入了一种基于支持向量数据描述(SVDD)的类间可分性度量方法,对SVM决策树分类器进行改进,实验表明,该方法有效地提高了SVM决策树多类分类器的分类精度和速度. 相似文献
11.
提出了一种将核Fisher鉴别分析特征抽取与多分类支持向量机算法结合的网络入侵检测技术,扩展了二分类支持向量机,利用经过核Fisher鉴别分析特征抽取后的训练数据构造优化的决策树,从而实现支持向量机的多分类.实验结果表明该算法能够提高检测正确率,同时降低训练时间,取得了良好的效果. 相似文献
12.
13.
14.
15.
常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性——网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集来源于同一个样本集而忽视了测试集中可能包含无类别样本的可能。基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD(Learning by Unlabeled Data)来改善分类效果,提高分类精度。实验证明:LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法。 相似文献
16.
对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4.5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4.5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。 相似文献
17.
基于决策树分类的云南省迪庆地区景观类型研究 总被引:3,自引:0,他引:3
决策树分类是基于空间数据挖掘和知识发现的监督分类方法。本研究利用遥感TM数据和DEM数据,构建分类决策树,并通过ENVI软件实现决策树分类,得到迪庆地区的景观类型分布图。同时利用传统的监督分类的方法进行分类,得到该地区景观类型分布图。利用野外实地采样的数据对两种分类方法进行精度评价,结果表明,两种分类方法的总体分类精度分别为85.5%和67.4%,决策树分类方法的总体分类精度比传统监督分类提高了近20%。在此基础上,研究云南省迪庆地区的景观类型分布状况,可得到以下结论:迪庆地区的景观类型主要有河谷灌丛面积约占5.5%,针叶林面积约占36.16%,亚高山灌丛草甸面积约占3.4%,高山冰雪面积约占3.7%,裸地面积约占25.4%,水体面积约占4.4%。除裸地和水体外,其他景观基本都沿着山体按海拔高度和坡向分布,其中面积最大的为针叶林景观。这与该地区高山峡谷地貌吻合。 相似文献
18.
旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。 相似文献
19.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。 相似文献
20.
针对传统的异常信息流检测方法的不足,设计了一个异常信息流检测模型,该模型采用了数据挖掘中的决策树算法对信息流进行归纳分类,采用信息增益作为分类属性选择标准来构造规则决策树,针对网络流量进行分析,能提高检测速度.开辟了一条检测异常信息流的新途径. 相似文献