首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于概率主题模型的文献知识挖掘
引用本文:王萍.基于概率主题模型的文献知识挖掘[J].情报学报,2011,30(6).
作者姓名:王萍
作者单位:上海大学计算中心,上海,200444
基金项目:上海市教育科学研究项目《网络学习支持的有效性研究》(项目编号:B2609105)的阶段性研究成果
摘    要:对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。

关 键 词:概率主题模型  Topic-Author模型  文献  文献知识挖掘  

Literature Knowledge Mining Based on Probabilistic Topic Model
Wang Ping.Literature Knowledge Mining Based on Probabilistic Topic Model[J].Journal of the China Society for Scientific andTechnical Information,2011,30(6).
Authors:Wang Ping
Institution:Wang Ping (Computer Center,Shanghai University,Shanghai 200444)
Abstract:Knowledge mining in massive scientific literature collections can discover valuable and latent knowledge and improve usability effectively.The author's preliminary studies have verified the feasibility of LDA topic model for literature knowledge mining.This paper proposes a new probabilistic topic model:Topic-Author model,which jointly models information of literature content and authors.The model can discover topics and authors distribution over each topic. Based on the model,multi-dimension knowledge mini...
Keywords:probabilistic topic model  Topic-Author model  literature  literature knowledge mining  
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号