首页 | 本学科首页   官方微博 | 高级检索  
     检索      

特征融合在微博数据挖掘中的应用研究
引用本文:王和勇,洪明.特征融合在微博数据挖掘中的应用研究[J].现代情报,2015,35(5):68.
作者姓名:王和勇  洪明
作者单位:华南理工大学电子商务系, 广东 广州 510006
摘    要:针对传统的微博聚类分析中,只单独针对微博阅读数、评论数等数据(下称微博结构化数据)进行分类或者单独针对由微博内容进行文本分词得到的分词数据(下称微博分词)进行分类的问题,本文采用了Kohonen聚类,研究结合微博结构化数据和微博分词的融合数据聚类的效果是否比单独对微博结构化数据或对微博分词聚类有所提高。实证数据实验结果显示,微博结构化数据单独聚类会出现一个类的标准差特别大(本文称为离群类),而对融合数据聚类,微博结构化数据则不会出现离群类;融合数据聚类结果对微博分词的影响不显著。


The Study of Microblog Data Mining Using Feature Fusion
Authors:Wang Heyong  Hong Ming
Institution:Department of E-Business, South China University of Technology, Guangzhou 510006, China
Abstract:This paper focused the problem that traditional clustering analysis have focused on only structured data such as microblog reading numbers and microblog comment numbers(microblog segmentation)or only microblog text.In this paper,microblog metadata are combined with microblog text to form fusion data and Kohonen Network Clustering is applied to test if fusion data clustering is better than microblog metadata clustering and than microblog text clustering.Experiments indicates that microblog metadata clustering may cause a class with large standard deviation(outlier class)and on the contrary,fusion data clustering does not.Microblog text clustering performs as well as fusion clustering.
Keywords:
点击此处可从《现代情报》浏览原始摘要信息
点击此处可从《现代情报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号