共查询到20条相似文献,搜索用时 718 毫秒
1.
提出采用残差数据合并技术的冗余数据优化挖掘算法,利用训练集建立决策树模型,引入C4.5决策树模型进行冗余数据主特征建模,在主分量特征决策树下,引入残差数据合并技术,设定数据残差特征伴随追踪模式,把传统方法中用于滤除的数据信息进行拼接伴随追踪定位,实现了冗余数据特征的优化挖掘。把方法应用到网络流量时间序列数据处理中实现网络异常监测,仿真实验表明,新的数据挖掘算法能有效提取到冗余数据特征作为有用检测特征,数据挖掘效率大幅提高,有效促进了海量数据隐藏特征的挖掘和应用,设计的网络流量监测软件能提高网络管理和监测实效性。 相似文献
2.
《科技通报》2016,(9)
目的:探讨C4.5决策树算法结合主成分分析法(PCA)在新疆高发病食管癌X钡剂造影图像分类中的应用。方法:选取新疆高发病食管癌图像200张,其中蕈伞型和溃疡型图像各100张。对图像进行归一化、去噪和空间转换等预处理;对图像进行二尺度小波变换提取图像的低频信息,然后对其进行灰度共生矩阵法提取图像的特征;采用主成分分析(PCA)法对所提取的特征进行筛选;通过构造决策树C4.5算法分类器来验证特征的分类能力。结果:使用决策树C4.5算法分类器,对主成分分析获取的特征及综合特征进行分类。PCA选择的特征分类准确率为95%;使用综合特征分类准确率为80%。结论:综合特征的分类准确率与PCA选择的特征相比较低,表明在进行分类时,冗余特征可能会降低分类准确率;而本研究采用PCA选择后的特征分类准确率较高,表明该算法能有效减少冗余特征,弥补了过高维数的特征向量易引起维数灾难的问题,从而使得分类准确率得到了提高。一定程度上为后续的其它组织器官的特征提取提供了依据。 相似文献
3.
4.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。 相似文献
5.
主元分析(Principal component analysis,PCA)是一种经典的数据分析方法。本文将PCA方法应用于数据相关性分析中,以提取数据集变量的相关性信息。通过两个仿真实验验证了PCA方法提取数据相关性有效性。 相似文献
6.
为有效定位识别和提取网络流量序列的暂态性异常特征,针对网络异常流量特征扰动性和暂态性特点,提出一种基于小波分解的二叉分类回归决策树主分量特征优化跟踪特征提取算法。利用训练集建立决策树模型,采用二叉分类回归决策树模型进行主分量特征优化跟踪建模,利用双正交提升小波分解得到的各层细节信号对暂态性扰动特征的敏感性,实现网络流量异常特征的定位提取和识别。仿真实验表明,改进算法的抗干扰能力和分辨率提高显著,暂态性异常特征谱图分辨能力提高,异常特征分布谱清晰可见,展示了较好的特征提取和状态识别性能。 相似文献
7.
应用自组织特征映射SOM的人工神经网络模型,针对目前多数银行所采用的传统客户划分方法,存在没有针对性的满足客户的需求的缺点,充分利用自组织特征映射作为样本特征检测器的功能,将反映客户的高维数据特征输入SOM进行训练,训练之后的分类模型将可以对在线输入的客户信息进行合理的分类。客户分类是客户关系管理系统的核心功能之一,可以对客户获取、客户保持及客户增值等客户关系管理过程提供全面支持,对商业银行的CRM的有效运行提出了一种新的方法。 相似文献
8.
传统的测井技术采用普通的水合物分析方法,对采集到的水合物信息进行相关分析,与无井时的数据进行比对,无法反映弱水合物条件下的测井现状。提出一种改进多态SOM网络下的非均匀水合物测井实现方法,提取测井数据中的非均匀水合物信息,将信息输入改进的多态SOM网络进行神经网络分析,监测测井结果,由于非均匀水合物中包含了更多信息,所以监测结果更好。最后采用一组实际测井数据进行测试,结果显示,采用基于改进多态SOM网络分析方法,测井地带被正确的监测出来,可以很好的在探测领域中应用。 相似文献
9.
基于PCA与GA改进BP神经网络的高速公路项目融资风险评价 总被引:1,自引:0,他引:1
针对高速公路项目融资风险评价问题,提出主成分分析(Principal Component Analysis,PCA)与遗传算法(Genetic Algorithm,GA)改进BP神经网络相集成的高速公路项目融资风险评价方法。首先利用主成分分析对高速公路项目融资风险评价指标体系降维,然后把降维后的指标数据输入到遗传算法改进的BP神经网络,最后应用该方法对北方某省15条高速公路项目融资风险进行评价。实证研究表明该方法应用到高速公路项目融资风险评价中是可行可靠的。 相似文献
10.
本文将数据挖掘聚类分析技术融合到ETC运营管理过程中,分析了ETC交易数据三种关键的特征数据并构建了数据模型,采用轮廓系数对聚类结果进行科学评估。在聚类分析结果的基础上,对ETC用户进行二维分类,提出ETC的推广营销和ETC系统维护管理的方法和建议。 相似文献
11.
12.
13.
基于主元分析(PCA)的故障诊断方法是故障诊断领域一个重要研究分支。本文首先介绍了主元分析的理论,然后深入研究了基于主元分析方法的传感器故障检测问题。该方法能够在对测量参数相关性分析的基础上,将传感器测量值所组成的测量空间分解为主元和残差两个子空间,通过传感器实际测量数据与正常数据矩阵在残差子空间投影的比较,对传感器的故障进行检测。最后进行具体仿真,仿真结果表明主元分析法对传感器具有很好的故障检测能力。 相似文献
14.
针对k-均值聚类方法可能受初始选定的聚类中心的影响而过早收敛于次优解的不足,给出了一种基于自适应遗传算法的聚类分析方法(AGAC)。对该自适应遗传算法的构成要素及用其解决聚类问题的一般步骤给出了阐述。用VS 2008编写了该算法的程序用来对数字进行聚类取得了较好的聚类结果。 相似文献
15.
在对生态工业园区特点分析的基础上,提出生态工业园区综合评价指标体系,利用层次分析法确定指标权重.运用主成分分析和灰色关联度分析等方法,建立新的生态工业园区综合评价模型,并对中国9个生态工业园区进行综合评价. 相似文献
16.
针对小区域(区县)专利数据的特点,构建一套专利提取和分析方法,并详细阐述该方法的数据采集、数据清洗、数据分析、结果反馈调整等关键步骤. 相似文献
17.
在现实教学中,我们经常会碰到孩子的回答偏离了教师设计的教学目标的情况,出现这种现象的原因主要有两个方面:教案本身的缺陷和教师自身的问题。从以下三个方面着手可解决:(1)强化学情分析,把握活动起点;(2)基于学情分析,准确制定目标;(3)精细分解目标,提高目标达成。 相似文献
18.
中国工业行业技术创新能力差异及影响因素实证分析 总被引:2,自引:0,他引:2
陈傲 《科学学与科学技术管理》2007,28(11):81-84
以37个行业规模以上工业企业基础数据为研究样本。首先,应用统计分析中的因子分析法对评价指标分层归类,计算主因子得分;其次,对各主因子得分进行归一化处理,利用归一化因子得分与对应主因子的方差贡献率相乘后求和,得到样本总得分;最后,根据样本总得分进行分层聚类,判别我国工业行业技术创新能力差异的显著性,分析导致我国工业行业技术创新能力差异的关键影响因素。 相似文献
19.
文章基于统计方法对新疆工业环境污染进行了一定的研究,应用了主成分分析方法,找到各个行业的综合得分,判断出对环境污染比较大的行业,并加强管理;应用聚类分析方法,得到可以归为一类的行业,从而采取集中措施,减少投入,得到最大的成效,来减少环境的负担。综合这两个方面,更能准确的判断污染和指标的动态关系。 相似文献
20.
基于主元分析(PCA)的传感器故障检测方法中T2和SPE统计量是两个重要指标。首先介绍T2统计量超限而SPE没超限故障检测的方法。利用主元相关变量残差统计量代替平方预测误差SPE统计量,并采用累积方差贡献率确定PCA模型的主元数。该方法避免了SPE统计量的保守性。最后将该方法应用于电厂某机组工作过程检测中,通过仿真验证该方法的有效性。 相似文献