首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
提出采用残差数据合并技术的冗余数据优化挖掘算法,利用训练集建立决策树模型,引入C4.5决策树模型进行冗余数据主特征建模,在主分量特征决策树下,引入残差数据合并技术,设定数据残差特征伴随追踪模式,把传统方法中用于滤除的数据信息进行拼接伴随追踪定位,实现了冗余数据特征的优化挖掘。把方法应用到网络流量时间序列数据处理中实现网络异常监测,仿真实验表明,新的数据挖掘算法能有效提取到冗余数据特征作为有用检测特征,数据挖掘效率大幅提高,有效促进了海量数据隐藏特征的挖掘和应用,设计的网络流量监测软件能提高网络管理和监测实效性。  相似文献   

2.
提出一种基于最大熵功率谱估计的Hadoop云平台下网络音视频数据特征挖掘方法,实现对数据信息的高速访问。构建数据挖掘Hadoop云平台和数据挖掘访问模型,设计最大熵功率谱特征提取算法,采用分段思想将同一时间段的视音频数据进行群体分割,分段提取最大熵功率谱特征。将提取的特征信息进行维度匹配分箱和溯源处理,实现信息恢复,最终完成高速数据访问。仿真测试表明,该算法能有效地实现对网络音视频数据的特征挖掘,提高访问效率,访问响应时间较当前方法缩短明显。  相似文献   

3.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

4.
内容中心网络中,Internet用户通常更加关心移动终端的数据内容,需要对此进行有效挖掘,传统的内容中心网络移动终端数据挖掘模型采用关联性辅助挖掘算法,由于内容中心网络的数据之间的关联性是自反的和传递的,导致挖掘效果不好。提出一种基于压缩频谱联合特征识别的内容中心网络移动终端数据优化挖掘模型。构建网络模型和数据挖掘结构模型,进行移动终端数据提取预处理,该内容块被划分成多个分片,把特征数据并行化地存储到不同的存储服务器中,实现对移动终端数据的压缩频谱联合特征识别,达到数据挖掘的目的。仿真实验表明,采用该模型进行数据挖掘,具有较大数据挖掘吞吐量,使得数据存储对象数目有明显提升,数据挖掘精度和收敛性能得到提高。  相似文献   

5.
通过挖掘生物信息大数据,从生物信息大数据库中提取感兴趣的数据特征,分析生物信息大数据集的细节结构,提高对生物信息的采集、处理、存储、传播,分析能力。传统的生物信息大数据挖掘模型采用基于小波多窗谱提取的生物信息挖掘算法,由于生物特征的属性权重需求各异,数据挖掘精度不高,提出一种基于梯度采样局部收敛的生物信息大数据挖掘模型。首先构建生物信息大数据库模型和生物信息特征挖掘实体模型,采用提取采样局部收敛方法实现对数据挖掘模型的改进,通过求解最优输入控制序列以及索引系统最优目标函数,实现系统的控制输入和预测,使用梯度采样局部收敛的方法进行生物信息大数据挖掘检测,得到生物信息大数据的梯度采样局部收敛属性集合。仿真结果表明,能实时准确地实现对生物信息的储存、检索和分析,提高数据挖掘能力,收敛精度较高。  相似文献   

6.
基于语义挖掘的智能竞争情报系统研究   总被引:2,自引:0,他引:2  
语义挖掘是一种从非结构化数据中准确地提取有用信息和知识的新兴数据挖掘技术。利用语义挖掘对这些非结构化数据和信息进行智能采集、分析和处理,可以帮助企业快速建立起经济有效的竞争情报流程。本文融合语义挖掘的相关技术来探索竞争情报的智能采集与分析原理,构建了一个基于语义数据挖掘的企业智能竞争情报系统。  相似文献   

7.
对电磁脉冲信号相位特征的准确挖掘和参量估计可以有效准确地确定信号源的方位,实现对识别目标的准确定位。传统的相位特征挖掘算法采用贝叶斯估计算法,算法在受到脉冲干扰时估计性能不好。提出一种基于机器学习的电磁脉冲信号相位特征挖掘算法,实现对相位估计精度的改进提高。首先构建电磁脉冲信号的模型,得到相位特征挖掘模型原始模型,求解相位模糊数搜索结合解得到两个阵列输出数据的相位差。计算电磁脉冲信号参数相位补偿项,采用机器学习算法进行电磁脉冲信号相位特征挖掘,构建调频信号作为估计目标方位角的载波信号,采用最小二乘拟合求斜率最终实现相位特征等相关信息的挖掘。仿真实验表明,该算法能准确估计出电磁脉冲信号辐射源的相位等参数信息,相位特征挖掘性能较好,展示了优越的数据挖掘和目标检测定位性能。  相似文献   

8.
本文以高校学生信息数据为研究对象,主要以贫困学生信息数据为应用点,采用数据挖掘技术挖掘学生信息中的有用知识。本文围绕挖掘贫困学生信息这个主题,运用Apriori关联规则算法对得到的综合数据信息进行挖掘,并对Apriori算法的应用进行了改进,得出了有利于学生管理部门支持决策的知识。  相似文献   

9.
在嵌入式云信息平台设计中,需要设计物理层数据传输协议优化信息平台的数据调度和任务分配能力。传统的协议采用UDP协议构建云信息平台的中继物理层数据传输协议,产生大量的流量累积,导致物理层拥堵。提出一种基于双向中继负载均衡的嵌入式云信息平台物理层数据传输协议设计算法。构建嵌入式云信息平台的网络模型,对信息平台数据进行压缩处理,通过双向中继物理层数据传输,定义物理层数据传输的调控函数,实现对数据传输的物理层协议构建,实现数据动态分配。实验结果表明,采用该算法,能有效提高数据的传输效率,降低数据传输延时,优化信息传输部署。  相似文献   

10.
在软件故障测试和数据库访问中,对非显著特征数据的挖掘是难点,通过对非显著特征数据的挖掘,处理数据分布比较稀疏且呈现模式分布不规则的数据访问问题。提出一种基于链距离估计的非显著特征数据挖掘算法,在时域上对链距离估计模型进行平移处理,给出非显著特征数据的离群因子概念,提取关联度主特征量,基于链距离估计结果,得到有效特征挖掘概率密度值,实现对非显著特征数据挖掘算法改进。仿真实验表明,该算法使得无论是不同密度的点簇相互靠近还是出现模式偏离的情况,都能有效的挖掘出非显著特征点,从而增强了数据挖掘算法的有效性和通用性,采用该法能有效提高非显著特征数据的挖掘性能,数据挖掘的命中率较高,在数据库访问和软件故障测试等领域具有应用价值。  相似文献   

11.
随着互联网技术的发展,电子商务进入了海量数据时代,从这些海量数据里挖掘出有用的模式具有非常高的商业价值。常规的数据挖掘模型会依赖于特定的数据挖掘平台,而目前的数据挖掘平台并不能做到随时随地跨平台交换数据挖掘模型。文章提出基于PMML的电子商务数据挖掘方法,只要数据挖掘平台兼容了PMML规范就可以真正做到跨台平交换数据挖掘模型。文章重点研究了PMML语言是如何表示完整数据挖掘模型,并就某电商平台挖掘潜在客户的数据进行实验并分析实验结果,从而验证了方案的有效性。  相似文献   

12.
在CStor云数据库访问中,细粒度云存储数据的信息特征存在个体较大差异,访问路径产生多频偏移,数据访问调度性能受限。传统方法中采用PSO局部搜索方法进行访问路径修正,搜索效率低,个体更新较慢。提出一种基于细粒度云存储数据迭代恢复匹配的云数据库访问路径偏移修正算法,以PSO多信息融合Pareto支配集为指导,构建多信息融合细粒度数据的主特征模型,采用迭代恢复匹配方法增加了局部搜索提高搜索到全局最优解的几率,实现路径偏移修正。仿真实验采用3组测试集对CStor云数据库进行访问调度和路径偏移修正,结果表明采用该算法,实现对访问路径的动态实时修正,收敛距离较小,提高了CStor云数据库访问和数据挖掘性能。  相似文献   

13.
1.数据挖掘的概念和方法数据挖掘,顾名思义就是从大量的数据中挖掘出有用的信息,也就是从大量的、不完全的、模糊的、随机的数据中,抽取出潜在的、有价值的知识、模型或规则,挖掘出更有价值的信息的一个过程。银行业作为我国最早实现电算化的一个行业,在经过近20年的电算化发展过程中,积累了大量的信息数据,如何运用数据挖掘技术进行深层次地分析和挖掘,找出相关的  相似文献   

14.
提出一种基于信息融合的虚拟数据分离动态云存储设计方法。构建了虚拟数据的分离动态云存储调度模型,进行信息特征提取,对提取的云存储信息特征进行信息融合处理,实现虚拟数据分离动态云存储改进设计。仿真结果表明,采用该算法进行云存储设计,能较为准确地反映虚拟数据的细节信息特征,提高数据融合精度,为实现动态分离存储提供优化索引通道,进而提高云存储中数据调度性能。  相似文献   

15.
付泉 《科技广场》2007,(3):114-116
顾客在电子商务网站的访问行为会产生大量数据信息,这些数据中包含了大量对市场分析及预测有用的潜在信息,可运用数据挖掘技术对客户访问信息的Web数据进行挖掘,从而了解客户的访问行为。本文主要讨论了电子商务中挖掘信息的目标、方法及数据挖掘技术在电子商务中的几点应用。  相似文献   

16.
提出一种基于动态特征K-Means聚类的云计算中多源信息资源平台兼容性路由算法,构建了云计算环境下的多源信息资源通信模型,进行多源信息资源云分析及模型构建,基于动态特征K-Means聚类进行多源信息资源的平台的兼容性特征值挖掘与匹配。仿真结果表明,采用该算法进行云计算环境下的多源信息资源平台兼容路由设计,能提高了云计算平台资源使用效率,降低了CPU负载,节省了计算开销和通信开销,在云平台资源调度等领域就有较高的应用价值。  相似文献   

17.
混合云存储系统的大数据部署和管理过程中,出现大量冗余数据,需要对冗余数据合理删除,获取想要云端的数据,提高系统稳定性。传统的冗余数据删除算法会在分数阶Fourier域出现伪峰峰值,不能有效地对冗余数据进行检测滤波和删除处理,提出一种基于压缩特征码的混合云冗余数据删除算法。预测出不同时间片内混合云的任务执行期望完成时间,对混合云数据冗余主成分进行特征编码,表征为校验信息存储子集对部分冗余数据的块层结构,提高冗余数据删除性能,实现算法改进。仿真结果得出,该算法对云存储系统中冗余数据的检测性能较好,有效避免数据信息流的干扰特征造成的误删和漏删,冗余数据删除准确性高,具有较好的应用价值。  相似文献   

18.
韩宇  李春生 《科技通报》2012,28(4):75-78
很多应用中需要对海量信息进行数据处理、动态分析,但目前还无法从大量数据中自动提取定性规则。因此,迫切需要一种能够从海量数据中自动提取有效信息、及动态分析的方法。数据挖掘技术可以实现上述功能,但难以对海量数据空间进行有效划分。本文将云模型应用到数据挖掘领域,克服了传统数据挖掘方法在数据空间划分上的不足,提出一种二维尺度云变换方法,有效地实现了定性规则提取。  相似文献   

19.
突发浪涌数据下差异云平台数据间的关联性破坏概率逐渐增加,降低了数据在冗余环境下查询效率。按照突发浪涌数据下云平台的弱关联数据调度特征,通过基于Apriori的弱关联数据挖掘方法,采集突发浪涌数据下差异云平台的弱关联数据,通过改进离散粒子群算法优化任务节点数字串的编码形式,实现数据调度任务,对粒子位置更新公式进行优化,采用优化离散粒子群算法进行节点寻优,获取最佳调度节点集,实现突发浪涌数据下差异云平台的弱关联数据调度。实验结果表明,该调度方案能够优化云平台资源的使用效率和服务响应时间,提高了总执行效率,节省了云资源,具有较高的节能开销比和用户满意度。  相似文献   

20.
目前大多都是针对两种类型数据发现对照模式来获取相关信息,在多类数据中发现对照模式进行数据挖掘还具有很大的挑战性。现有的关联规则挖掘技术的瓶颈在于需要产生大量的规则,其中有很多都是冗余规则,而已存在的非冗余规则挖掘算法虽然去掉了冗余规则,但还是有很多规则对于特定的应用领域兴趣度太低或不感兴趣,因此给出了一种有效的多类医疗数据挖掘算法。该算法基于统计方法定义了诱因模式和安全模式,实现了在多类医疗数据中发现这两类模式,并在仿真实验中给出了仿真医疗数据清晰直观的因果关系图,而根据新算法产生的规则得出的分类器也验证了新算法的高效性和实用性,且新算法产生的规则提供了精确而且非常有用的信息,可被实际应用在医疗研究以及其它领域中。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号