期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

王敏谢峰《科技通报》2013,(10)

提出一种基于随机决策树以及自适应门限变换的漂移数据抗干扰镇定模型,把随机决策树融入Hoeffding Bounds不等式检测概念漂移数据并过滤其中的干扰因素,通过自适应门限的抗干扰阀值算法,实时跟踪并抑制相关的干扰因素处理,确保网络通信的顺利运行。实验结果说明,该模型的检测准确率、抗噪性、分类精度都优于传统模型,取得了令人满意的效果。相似文献

2.

基于云理论的文本分类方法

姜健《黑龙江科技信息》2009,(36):137-137

提出一种基于云理论和神经网络构造决策树的文本分类方法。运用云神经网络学习变量间的云映射关系,从中生成云决策树。这种方法结合了神经网络的学习算法和决策树的推理方法,具有神经网络的学习能力,并且应用了云发生器对处理不确定性的能力。更符合人类的思维方式,从而进一步提高了文本分类的效率、准确性和可靠性。相似文献

3.

基于数据挖掘的学生成绩预测的应用浅析

《黑龙江科技信息》2017,(7)

决策树算法是数据挖掘技术中常用的方法,在分类和预测方面有着广泛的应用。本文简要地介绍了决策树ID3算法的基本思想,通过数据实例说明了构造决策树的实现过程,实现了对学生成绩的预测。相似文献

4.

基于ETM＋影像的凌源市土地利用遥感分类方法的研究

李铁柱李铮宫斌赵磊《黑龙江科技信息》2011,(22):78-79

本文以辽宁省凌源市为研究对象,采用RS技术,以ETM＋数据为信息源,使用ENVI遥感影像处理软件进行数据处理,对凌源市土地利用类型进行分类,并对分类结果进行精度比较分析。分类的方法包括非监督分类,监督分类的最大似然法分类以及决策树分类。采用混淆矩阵法对三种分类结果进行精度分析。结果表明,非监督分类与最大似然法分类的总体精度分别为84.34%、85.82%,精度不高。在决策树分类中,对数据进行地物光谱特征分析、NDVI特征分析、主成分分析并结合DEM数据,建立一棵比较合理的决策树,总体分类精度达到90.65%。相似文献

5.

数据挖掘中决策树分类算法的研究与改进

但小容陈轩恕刘飞柳德伟《人天科学研究》2009,(2)

决策树分类算法是数据挖掘中一个重要的内容,而ID3算法又是决策树分类算法中的一种重要方法且被广泛应用。然而在实际应用过程中,现存的决策树算法也存在着很多不足之处,如计算效率低下、多值偏向等。为了解决这些问题,提出了一种基于ID3算法的加权简化信息熵算法,它提高了决策树的构建速度,减少了算法的计算运行时间,同时也克服了ID3算法往往偏向于选择取值较多的属性作为测试属性的缺陷。并且随着数据规模的增大,决策树的分类性能表现得越好。相似文献

6.

一种改进的PEP决策树剪枝算法

罗涛王华金《科技广场》2010,(6):49-51

剪枝过程是决策树分类学习中的重要环节,能够简化决策树并提高决策树的泛化能力,避免对训练数据集的过适应。在PEP算法的基础上,本文提出了一种改进的决策树剪枝算法IPEP,实验结果表明,该算法剪枝效果较PEP算法更好。相似文献

7.

决策树分类算法及其应用

《黑龙江科技信息》2017,(25)

本文详细介绍机器学习分类算法中的决策树算法,并详解如何构造,表示,保存决策树,以及如何使用决策树进行分类问题。相似文献

8.

引入宽度优先扩展概念的多样性数据分类过程

何一辉向俊《科技通报》2013,(10)

随着信息技术的迅猛发展,大型数据库中的数据正在呈几何级数增长,冗余分类技术已经成为信息组织的重要手段。在总结归纳已有的冗余分类算法弊端的基础上,参考决策树算法提出了一种新的基于数据库抽样的海量数据冗余分类算法。算法引入宽度优先扩展思路,并给出了算法的基本思想和具体实现过程,探讨了并行环境下进行计算的优化步骤。在与SPRINT算法的比较实验中,新算法展现了良好的性能和分类效率。相似文献

9.

基于Spark的权重树随机森林算法

《中国科技信息》2017,(13)

<正>point高维数据中很多特征所含有的分类信息少,面对这些数据,随机森林算法会产生很多分类能力弱的决策树,而其在集成决策树时无法差异化区分每一棵决策树,造成分类能力弱的决策树影响算法整体的分类性能。针对这一问题,提出一种权重树随机森林算法,依据权重对树进行集成,增强分类能力强的树对分类决策的权重,同时削弱分类能力弱的树对分类决策的权重,从而提高整个随机森林的分类决策性能。单机运行模式不能满足高效分类高维数据的需求,开源集群计算框架Spark能够内存相似文献

10.

一种改进的SVM决策树文本分类算法 总被引：1，自引：0，他引：1

赵天昀《情报杂志》2010,29(8)

将SVM和二叉决策树结合起来构成SVM决策树的方法能够较好地解决多类文本分类问题,在此基础上引入了一种基于支持向量数据描述(SVDD)的类间可分性度量方法,对SVM决策树分类器进行改进,实验表明,该方法有效地提高了SVM决策树多类分类器的分类精度和速度. 相似文献

11.

基于核Fisher鉴别分析的网络入侵检测算法

张力杰《科技创业月刊》2009,22(12):178-179

提出了一种将核Fisher鉴别分析特征抽取与多分类支持向量机算法结合的网络入侵检测技术,扩展了二分类支持向量机,利用经过核Fisher鉴别分析特征抽取后的训练数据构造优化的决策树,从而实现支持向量机的多分类.实验结果表明该算法能够提高检测正确率,同时降低训练时间,取得了良好的效果. 相似文献

12.

决策树分类算法研究综述 总被引：4，自引：0，他引：4

季桂树陈沛玲宋航《科技广场》2007,(1):9-12

本文基于决策树分类算法的研究现状,重点介绍了一些极具代表性的算法,包括ID3、C4.5等,对各种决策树分类算法的基本思想进行阐述,分析比较各种典型算法的优点和不足,并对决策树分类算法所面临的问题进行了简要的阐述,为数据分类研究者提供借鉴。相似文献

13.

基于SMOTE不平衡扩充采样算法的改进

宣晶雪张权李晓红王书宜《科技风》2023,(12):1-3

针对不平衡数据集少类样本分类精度低的现象,本文提出了一种新的不平衡数据扩充采样算法。改进算法通过距离度量,在少类样本中心与其近邻间进行随机线性插值,使数据平衡。改进算法与SMOTE算法、C＿SMOTE算法分别对5个不平衡数据集进行扩充分类对比实验,基于AUC、OOB、F值与G值评价指标及成对样本T检验,证明改进算法能有效缓解类不平衡,并具有更优异的不平衡数据处理性能。相似文献

14.

基于Sentinel 2影像的青衣江流域土地利用分类

《黑龙江科技信息》2020,(10)

以四川省青衣江流域乐山灌区为研究区域,Sentinel 2光学影像为数据源,采用分类方法最大似然法、CART决策树法和基于多时相归一化植被指数(Normalized Difference Vegetation Index,NDVI)决策树分类方法,实现了研究区域大春土地利用的分类提取,对各种分类结果的精度评定结果表明基于相应多时相NDVI数据集的决策树分类方法在3种分类方法中精度最高,总体分类精度85.22%,Kappa系数0.81。最终本研究技术方法成功提取了青衣江流域建筑、水、森林的分布信息及大春作物水稻、红苕、大春蔬菜的作物种植信息。相似文献

15.

一种基于不完整数据集的网页分类技术

蔡崇超《人天科学研究》2011,10(1):143-145

常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性——网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集来源于同一个样本集而忽视了测试集中可能包含无类别样本的可能。基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD（Learning by Unlabeled Data）来改善分类效果,提高分类精度。实验证明：LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法。相似文献

16.

基于C4．5的决策树改进算法研究

徐东风《人天科学研究》2013,(10):61-63

对海量数据的处理能力是数据挖掘最关注的问题。决策树作为一种分类器,是数据挖掘中用到的一种基本方法之一。基于C4．5的决策树改进算法,是在一些典型的决策树分类算法的基础上提出的,基本思想是在建树过程中,用属性依赖度替代信息增益率来确定划分条件属性的顺序。该算法借鉴MedGen算法的阈值设定方法,在简化决策树剪枝和优化过程的同时,可优化C4．5算法中使用信息熵率的时间复杂度,避免了使用信息熵带来的不当划分。简述了该改进算法的执行过程,证明了算法的正确性。相似文献

17.

基于决策树分类的云南省迪庆地区景观类型研究 总被引：3，自引：0，他引：3

李亚飞刘高焕黄翀《资源科学》2011,33(2):328-334

决策树分类是基于空间数据挖掘和知识发现的监督分类方法。本研究利用遥感TM数据和DEM数据,构建分类决策树,并通过ENVI软件实现决策树分类,得到迪庆地区的景观类型分布图。同时利用传统的监督分类的方法进行分类,得到该地区景观类型分布图。利用野外实地采样的数据对两种分类方法进行精度评价,结果表明,两种分类方法的总体分类精度分别为85.5%和67.4%,决策树分类方法的总体分类精度比传统监督分类提高了近20%。在此基础上,研究云南省迪庆地区的景观类型分布状况,可得到以下结论:迪庆地区的景观类型主要有河谷灌丛面积约占5.5%,针叶林面积约占36.16%,亚高山灌丛草甸面积约占3.4%,高山冰雪面积约占3.7%,裸地面积约占25.4%,水体面积约占4.4%。除裸地和水体外,其他景观基本都沿着山体按海拔高度和坡向分布,其中面积最大的为针叶林景观。这与该地区高山峡谷地貌吻合。相似文献

18.

基于粗糙集的决策树旅游景点信用评估模型的设计与实现

石东贤《科技风》2012,(2):277-278

旅游景点信用评估是一种典型的分类问题,本文概述了粗糙集和决策树的理论,基于这两种理论,提出了一个基于数据挖掘粗糙集理论与决策树分类技术相结合的信用评估方法来建立旅行景点的信用评估模型,利用粗糙集的知识约简的概念,对样本数据进行预处理,去除冗余属性对分类模型的影响,然后用决策树方法建立分类模型。最后通过Pawlak重要度的属性约简算法和ID3决策树算法实现了该模型。相似文献

19.

数据挖掘算法在债务管理中的应用

吴文豪《科技风》2011,(12)

决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。相似文献

20.

基于数据挖掘技术的异常信息流检测模型

师东生《科技创业月刊》2010,23(4)

针对传统的异常信息流检测方法的不足,设计了一个异常信息流检测模型,该模型采用了数据挖掘中的决策树算法对信息流进行归纳分类,采用信息增益作为分类属性选择标准来构造规则决策树,针对网络流量进行分析,能提高检测速度.开辟了一条检测异常信息流的新途径. 相似文献