首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于谱分量相似度的多数据流聚类算法
引用本文:邹凌君,陈峻,屠莉.一种基于谱分量相似度的多数据流聚类算法[J].东南大学学报,2008,24(3).
作者姓名:邹凌君  陈峻  屠莉
作者单位:[1]扬州大学信息工程学院,扬州225009 [2]南京大学计算机软件新技术国家重点实验室,南京210093 [3]南京航空航天大学信息科学与技术学院,南京210016
基金项目:国家自然科学基金,江苏省自然科学基金
摘    要:提出了一种新的多数据流聚类算法.该算法可以有效地对有相似行为但存在一定时间延迟的多数据流进行聚类.算法采用自回归模型技术度量数据流间的延迟相关,利用频谱估计来抽取数据流的特征.每一个数据流用其谱分量的和来表示,从而来计算每对数据流间的相关关系.每个谱分量用振幅、相位、衰减率、频率4个参数来描述.算法计算谱分量对之间的ε-延时相关关系,并以此为基础来得到聚类分析中数据流间距离的度量.此外,算法采用滑动窗口技术对多数据流进行聚类,实时地得出聚类结果且动态地调节聚类的个数.在人工数据集和实际数据集上的实验结果表明,所提出的算法比其他类似的算法具有更快的速度和更好的聚类效果.

关 键 词:数据流  聚类  AR模型  谱分量

Clustering algorithm for multiple data streams based on spectral component similarity
Zhou Lingjun,Chen Ling,Tu Li.Clustering algorithm for multiple data streams based on spectral component similarity[J].Journal of Southeast University(English Edition),2008,24(3).
Authors:Zhou Lingjun  Chen Ling  Tu Li
Abstract:
Keywords:data streams  clustering  AR model  spectral component
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号