首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于域加权聚类算法的网络舆情热点话题探测
引用本文:陆伟,刘屹,孟睿,陈英杰.基于域加权聚类算法的网络舆情热点话题探测[J].数字图书馆论坛,2011(8):50-56.
作者姓名:陆伟  刘屹  孟睿  陈英杰
作者单位:武汉大学信息资源研究中心 武汉430072
基金项目:本项目为教育部人文社会科学规划项日“专家专长智能识别与检索系统实现研究”(项目编号:99yja870021)和教育部人文社科重点研究基地重大项目“面向细枉度的网络信息检索模型及框架构建研究”成果之一.
摘    要:面对自由无序的网络舆情信息,对舆情组织方式的研究体现出重要研究意义。文章提出一种网络舆情信息的组织方法,采用域加权的方式,通过一种single-pass增量算法聚类实现面向主题的舆情信息组织,即对新闻主题或新闻事件有较强表达能力的域进行加权处理以突出该主题或事件,再以无监督自动化的方式对无序的网络舆情信息进行聚类,进而发现热点话题,达到话题探测的目的。实验结果显示,聚类类簇均基于主题或事件,可以代表一个话题,F-measure评价值在85%以上,也进一步表明了本研究方法的有效性。

关 键 词:网络舆情  域加权  热点话题发现  聚类算法

Hot Topics Detection of Web Public Opinion Based on Field-weighted Clustering Algorithm
Lu Wei,Liu Yi,Meng Rui,Chen Yingjie.Hot Topics Detection of Web Public Opinion Based on Field-weighted Clustering Algorithm[J].Digital Library Forum,2011(8):50-56.
Authors:Lu Wei  Liu Yi  Meng Rui  Chen Yingjie
Institution:/ The Center for the Studies of Information Resources of Wuhan University, Wuhan, 430072
Abstract:The research of information organization shows great significance when dealing with large amount ofunordered web public opinion information. In this paper, we introduce a new organization method for web public opinion. We highlight the subject by weighting text fields which are more effective to express the theme, and then deal with unsupervised clustering. By analyzing public opinion information, we realize the purpose of topic detection. In this method, the F-measure is more than 85%, which shows the effectiveness of letting clusters represent themes.
Keywords:Web public opinion  Field-weighted  Hot topics detection  Clustering algorithin
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号