文章摘要

章成志,张庆国,师庆辉.基于主题聚类的主题数字图书馆构建[J].中国图书馆学报,2008,34(6):
基于主题聚类的主题数字图书馆构建
Construction of Subject Digital Libraries Based on Subject Clustering
  
DOI:
中文关键词: 数字图书馆,主题聚类,主题抽取,文本聚类
英文关键词: Digital library,Subject clusetering,Subject extraction,Text clustering
基金项目:本研究受“十一五”国家科技支撑计划重点项目“科技文献信息服务系统关键技术研究及应用示范”子课题(2006BAH03B02、2006BAH03B04)、南京理工大学青年科研扶持基金项目“基于机器学习方法的领域本体学习研究”(JGQN0701)和南京理工大学科研启动基金项目“主题聚类关键技术研究”(AB41123)资助。
作者单位
章成志 南京理工大学信息管理系 南京 210094 
张庆国 中国学术期刊(光盘版)电子杂志社 北京 100084 
师庆辉 中国学术期刊(光盘版)电子杂志社 北京 100084 
摘要点击次数: 4342
全文下载次数: 3351
中文摘要:
      基于主题聚类的主题数字图书馆是针对某一个特定的主题,获取与该主题相关的数字资源集合(本文以文本资源为研究对象),然后再依据主题聚类算法,对该主题的信息资源集合进行聚类,生成可供用户浏览的多层次结构导航,结合全文检索实现基于主题聚类的主题数字图书馆系统。主题数字图书馆系统主要包括主题采集模块、主题聚类模块和数据集成模块,构建过程中主要涉及主题提取、主题聚类以及聚类结果描述等三类关键技术。表2。图1。参考文献20。
英文摘要:
Subject digital library based on subject clustering is a subject digital library system focused on a particular subject, collecting subject related digital resources (mainly text resources in this article), clustering information resource subsets by subject clustering algorithms, generating hierarchically structured navigation for users and integrating full text retrieval. The system should include a subject acquisition module, a subject clustering module and a data integration module. In the construction of such a system, we can use three key technologies of subject extraction, subject clustering and subject result description. 2 tabs. 2 figs. 20 refs.
查看全文   查看/发表评论  下载PDF阅读器