首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
为了解决电力工业中并行数据流范围聚集的连续查询问题,提出一种新颖的数据流划分方法.首先构造了一个适用于数据流处理的扩展蓄水池抽样算法,根据流值变化率引入跳跃因子反应负荷数据的变化情况,实现数据流的自适应并行采样.然后为了实现数据流量的平均划分,基于近似技术提出2种适应不同情况的生成等深柱状图的算法:增量更新的启发式方法和周期性更新的快捷方法,从而在采样的基础上生成近似划分向量.通过在实际数据集上对算法性能测试,证明文中提出的数据流划分方法高效实用,适合于高速时变数据流的处理.  相似文献   

2.
提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.  相似文献   

3.
提出基于动态时间弯曲技术的流数据处理方法,将一段时间内采集到的流数据作为一个时间序列来进行处理.由于同一时间段内数据流变化的影响因素基本相同,导致一些数据流变化存在错位相似,具体表现为数据流形状大致相同,但在时间上有所超前或延迟.对于这种错位相似的数据流采用常用的欧几里得测度法是无法识别的,而采用动态时间弯曲技术却可以很好地判断数据流的这种相似性.在采用动态时间弯曲路径法得到两个时间序列对应点的基础上提出了用预测法估计两个时间序列的关系,从而确定时间序列最佳匹配点的算法.  相似文献   

4.
提出一种基于相似度特征匹配和自适应资源调度的工业生产物流供应链大数据资源融合技术。首先构建了工业生产物流供应链大数据资源调度数据处理平台,进行物流供应链的大数据特征采样,对采样的数据流进行相似度特征匹配。采用自适应资源调度方法进行数据滤波和特征融合,以此为基础进行物流供应链的优化调度,以提高大数据的并行处理效率。仿真结果表明,利用该算法进行大数据资源融合效率较高,配准性能较好,执行时间短,性能优于传统算法。  相似文献   

5.
由于照相机等设备的便携化和互联网的触手可得,每天有海量互联网图像产生。针对这种情况,提出了基于MapReduce的互联网图像相似性度量算法。算法首先提取了语义级的图像特征,包括图像的主要颜色、形状和构图等,然后基于上述图像特征归一化,设计合理的Map方法和Reduce方法,并行计算出输入图像与图像库中的图像的相似性评分,排序得到最相似图像的几幅图形,最后构建了基于MapReduce的互联网相似图像搜索系统。实验结果表明,基于MapReduce的图像相似性度量算法,同样适用于互联网海量图像,并比传统的图像相似性度量算法具有更好的灵活性和可扩展性。  相似文献   

6.
在动态数据流挖掘过程中,对数据流进行聚类,把未知的数据流划分或者生成到一个簇中。发现隐含的知识、价值和模式,是一种非常有效的数据流挖掘技术。分析和研究了数据流挖掘的聚类算法,并对数据流聚类技术发展进行了展望,提出了数据流挖掘的研究方向。  相似文献   

7.
数据流分段是数据流处理技术的基本任务,然而,它在多数据流环境下并不是一个小问题。该文提出了一个高效算法(即QPAAS算法),它能实时处理多个数据流分段。该算法利用了PAA技术中的增量计算特性,能快速处理单个数据流分段。为了处理多个数据流,它索引所有数据流的当前分段到一颗B^+树中,这样算法即可实时分段多个数据流。在真实的数据流上的多个实验表明,QPAAS算法有效而高效,仅具有线性时间和空间复杂度。而且,它比传统的PAA分段算法快几个数量级。  相似文献   

8.
客户关系数据库中拥有大量的客户记录,其中许多记录构成相似重复记录,检测、清洗进而合并相似重复记录可以提高存储空间的利用率,还可以加快记录查询的速度。在研究客户记录的基础上,提出一种客户关系数据库相似重复记录清洗算法,算法首先对记录进行排序,设定属性权重和记录相似度闸值,通过计算相邻记录的相似度判定记录是否相似重复,最后对检测到的相似重复记录进行清洗与合并。  相似文献   

9.
介绍了时间序列相似性搜索研究的现状,以指定查询序列搜索为算法基础,将其应用于具体的数据统计实践中去.时向序列相似性搜索研究具有挑战性及局限性.  相似文献   

10.
针对少样本学习问题,提出基于自适应特征比较的算法.通过元学习的策略,在训练集中以基于自适应特征比较的方式学习到可用于直接判断查询图像与每一张训练图像类别相似度分数的知识;利用学习到的知识,在测试过程中将所有支撑图像与查询图像经过一遍前向计算,选取与查询图像经特征比较最相似的一幅支撑图像的类别作为查询图像的类别.算法由特征提取和特征比较两个卷积神经网络子模型组成,分别实现图像空间到特征空间的转换和比较两个特征属于同一类别的相似度.两个子模型组合成一个统一的网络通过端到端的方式进行训练,在两个常用少样本学习公开评测集Omniglot和miniImagenet上的实验证明了提出的算法能够提升少样本学习的性能.  相似文献   

11.
针对URMS的特点,在其查询组件中设计了一种基于流的XML查询算法.详细地介绍了由查询表达式构造查询自动机的步骤;实现了一个基于流的XML文档查询系统的原型.通过实验表明,提出的方法能够适应XML流的查询,在内存利用率上优于传统的基于内存的XML查询算法.  相似文献   

12.
提出了一个普通的多关系半连接操作查询优化算法,并在该算法基础上加以改进,结果表明:当Card(R)远远大于Card(R)时,改进算法减少了数据的传输量,减少了查询的总代价,从而操作效率大大的提高.  相似文献   

13.
为了在保证检测准确率的前提下提高检测效率,并优化SDN网络中基于流表特征的DDoS攻击检测算法,主要分析基于流表特征的DDoS攻击检测技术及其存在的不足,提出首先利用主成分分析优化流表特征,从中选出合适的特征子集,并采用支持向量机算法实现分类检测;然后搭建仿真网络环境,利用正常数据集与攻击数据集训练分类器进行测试实验;最后从检测准确率与检测时间两个维度对特征降维前后的检测方法进行对比。实验结果表明,经过特征降维的检测方法在不影响准确率的同时,有效提高了检测速率。  相似文献   

14.
图像检索中基于最大信息获取量的主动学习算法   总被引:1,自引:0,他引:1  
本文提出一种基于内容的图像中的主动学习算法. 首先用支撑向量机学习得到初始查询概念, 然后用相似性测度对其进行检验, 选取信息量最大的样本来请求用户标记, 最后在相关反馈的迭代优化过程中获取用户的图像查询概念. 算法通过支撑向量机二值分类器与相似性测度2种不同学习模型的融合, 来减轻它们各自所存在的模型偏置. 实验结果显示, 所提算法能够显著提高图像检索的精确度, 在少量的反馈迭代之后即能准确地获取目标概念.  相似文献   

15.
基于云计算所带来的巨大好处,就高校考试管理系统的架构、服务接入模式及数据存储方式,提出考试系统的SOA云计算平台架构解决方案;分析考试安排的NP完全问题模型,设计并实现基于SQL关系运算的考试安排算法;业务上采用考试任务流程化,实现高校考试组织和管理。  相似文献   

16.
17.
针对一种新型的基于社区多角色的结构化P2P网络模型特点,提出了一种新的查询算法,即迭代扩展查询算法。该算法利用反馈机制,将已经返回的结果统计信息反馈到前端查询Q,指导查询Q向外路由的策略。将该算法与Chord网络查询算法进行了分析比较,使用P2Psim进行模拟验证。仿真结果表明,该网络模型性能稳定,资源查询速度快,通信量小,结果优良。  相似文献   

18.
通过将UMQL查询的各类条件式映射为UMQA的对应代数算子,给出从UMQL多媒体查询到UMQA查询计划的等价转换算法,为任意UMQL查询生成等价的内部UMQA查询计划.然后,为了有效改善UMQA查询计划的执行代价,研究了等价UMQA代数变换规则和一般性优化策略,给出UMQA内部计划的优化算法.该算法基于等价规则变化UMQA查询计划,并使优化后的查询计划尽可能符合优化策略.最后,讨论了UMQA查询计划的逻辑执行方法,即UMQA代数算子的逻辑执行方法,以便从多媒体数据库中获取用户感兴趣的目标数据.这些算法均在一个UMQL原型系统中实现,且应用效果表明这些查询处理技术均切实可行.  相似文献   

19.
Finding all occurrences of a twig query in an XML database is a core operation for efficient evaluation of XML queries. It is important to effectively handle twig queries with wildcards. In this paper, a novel path-partitioned encoding scheme is proposed for XML documents to capture paths of all elements, and a twig query is modeled as an XPattern extended from tree pattern. After definition, simplification, normalization, verification and initialization of the XPattern, both work sets and a join plan are generated. According to these measures, an effective algorithm to answer for a twig query, called DMTwig, is designed without unnecessary elements and invalid structural joins. The algorithm can adaptively deal with twig queries with branch([]), child edge(/), descendant edge(//), and wildcard(*)synthetically. We show that path-partitioned encoding scheme and XPattern guarantee the I/O and CPU optimality for twig queries. Experiments on representative data set indicate that the proposed solution performs significantly.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号