首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于单句粒度的微博主题挖掘研究
引用本文:唐晓波,肖璐.基于单句粒度的微博主题挖掘研究[J].情报学报,2014,33(6).
作者姓名:唐晓波  肖璐
作者单位:1. 武汉大学信息系统研究中心,武汉,430072
2. 武汉大学信息资源研究中心,武汉,430072
基金项目:国家自然科学基金资助项目“社会化媒体集成检索与语义分析方法研究”(项目
摘    要:针对现有主题挖掘方法的不足,本文提出一种以句子为粒度的微博主题挖掘方法.首先,以标点符号为依据进行微博文本的句子划分,选择名词和动词为特征词来表征句子;其次,以高频特征词在微博文本集中的共现频次为基础构建词语相似矩阵,辅助计算句子相似度,构建句子相似矩阵;然后,以句子相似矩阵为基础进行聚类分析,通过分析聚类结果实现主题发现;最后,利用改进的LexRank算法计算各主题句子的重要度值,组合重要度值高的句子生成主题摘要,以完成对主题的描述.文章通过实验证明了该方法的可行性.

关 键 词:单句粒度  词语相似矩阵  主题挖掘

Research of Micro-Blog Topics Mining Based on Sentence Granularity
Tang Xiaobo,Xiao Lu.Research of Micro-Blog Topics Mining Based on Sentence Granularity[J].Journal of the China Society for Scientific andTechnical Information,2014,33(6).
Authors:Tang Xiaobo  Xiao Lu
Abstract:
Keywords:sentence granularity  word similarity matrix  topics mining
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号