首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于PLSA的大众标注资源主题挖掘*
引用本文:王嵩,代逸生,李保珍.基于PLSA的大众标注资源主题挖掘*[J].现代图书情报技术,2010,26(3):47-51.
作者姓名:王嵩  代逸生  李保珍
作者单位:(江苏科技大学经济管理学院    镇江 212003)
基金项目:*本文系教育部人文社会科学研究项目“Web2.0环境下基于大众标注的网络民意跟踪与鉴别模式”(项目编号: 09YJC870010) 和江苏省教育厅高校哲学社科基金项目“基于大众标注的网络舆情监测”(项目编号:09SJB860002)的研究成果之一。
摘    要:针对大众标注中用户生成标签的随意性以及无规则性所导致的标签混乱问题,引入潜在语义索引分析PLSA算法,得到特定资源主题下的标签集,为网络信息组织及用户获取提供有效的途径。通过抽取Delicious网站中的用户标注信息,证实PLSA方法对于特定资源的主题特征具有比较好的效果。

关 键 词:大众标注  概率潜在语义分析  语义标签  资源主题
收稿时间:2010-02-01
修稿时间:2010-03-08

Explore Network Resource Topics from Social Annotations System Based on PLSA
Wang Song Dai Yisheng Li Baozhen.Explore Network Resource Topics from Social Annotations System Based on PLSA[J].New Technology of Library and Information Service,2010,26(3):47-51.
Authors:Wang Song Dai Yisheng Li Baozhen
Institution:(Economic & Management School, Jiangsu University of Science and Technology, Zhenjiang 212003,China)
Abstract:Due to the random of mass tagging user-generated tags and non-regularity of confusion arising from the label, this paper introduces the Probabilistic Latent Semantic Analysis (PLSA) algorithm for latent semantic indexing analysis,gets the label set of specific resources under the theme and provides an effective approach for the network information organization and the user’s access. By taking the user annotation information through Delicious site,the paper substantiates that the PLSA approach can achieve a good result for the subjects of particular resources.
Keywords:
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号