首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于层次概率主题模型的科技文献主题发现及演化
引用本文:王平.基于层次概率主题模型的科技文献主题发现及演化[J].图书情报工作,2014,58(22):70-77.
作者姓名:王平
作者单位:武汉大学信息管理学院
基金项目:本文系国家自然科学基金青年科学基金项目“多因素融合下的微博话题可信度评估模型及实证研究”(项目编号:71303179)研究成果之一.
摘    要:自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.

关 键 词:主题发现  主题演化  层次概率主题模型  
收稿时间:2014-09-01

Topic Extraction and Evolution for Scientific Literature Based on Hierarchical Probabilistic Topic Model
Wang Ping.Topic Extraction and Evolution for Scientific Literature Based on Hierarchical Probabilistic Topic Model[J].Library and Information Service,2014,58(22):70-77.
Authors:Wang Ping
Institution:School of Information Management, Wuhan University, Wuhan 430072
Abstract:Automatic mining scientific literature's topic and observing topic change for researchers will play great role in understanding and accessing the latest research frontiers on certain field. This paper analyzed topic extraction and evolution approaches of scientific papers by examining the characteristics of the diversity and dynamics of scientific papers, and based on hierarchical probabilistic topic model, using Gibbs sampling to estimate the model parameters and choosing the high-quality topic words by means of mutual information. This paper finally used Pro/Post-discretized analysis to study the topic evolution. The experimental results show that topic extraction and evolution method proposed in this paper are feasible and effective.
Keywords:topic extraction  topic evolution  hierarchical probabilistic topic model  
点击此处可从《图书情报工作》浏览原始摘要信息
点击此处可从《图书情报工作》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号