首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 767 毫秒
1.
基于主题聚类的学科研究热点及其趋势监测方法   总被引:1,自引:1,他引:0  
常规的学科热点及趋势监测方法存在监测成本高、监测信息相对滞后等问题.因此需要寻求较低成本、较快速的方法进行学科热点和趋势的监测,以保证监测系统提供信息的时效性.本文以图书情报档案学科为例,依据学科学术论文全文,从主题角度对学术论文集合进行全面分析,即:采用主题聚类方法,对包括时间信息的学科学术全文进行主题分析与主题聚类,归纳出某一特定学科的研究热点和这些热点的发展趋势.实验结果表明,基于主题聚类的学科热点及其趋势监测方法,其监测结果在很大程度上接近于常规方法的监测结果,但基于主题聚类的监测方法,在监测成本和监测信息时效方面得到改善.  相似文献   

2.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

3.
面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,并利用TextRank生成聚类标签,然后基于主题间层次结构,利用图模型将不同提问文本的关联关系呈现出来,从而构建网络问答社区用户提问主题聚类图谱,以此提升网络问答社区平台知识资源的组织与利用效率,为知识查询和推荐提供索引。  相似文献   

4.
针对现有主题排序偏主观、高维数据复杂难处理等问题,提出一种基于近邻传播聚类和天际线算法的主题排序方法。结合关键词重要性和近邻传播聚类算法自适应获取文献初始核心主题,借助平均相似性系数进一步对初始主题簇进行二次近邻传播聚类。以簇中心代表关键词的篇均被引量和篇均下载量为主题热度表征指标,利用天际线算法获取主题天际线集合,通过主成分分析法实现主题排序。对中国知网2010—2020年与供应链相关的期刊文献进行数据处理和挖掘时发现,本文提出的新方法可以有效地识别供应链领域研究主题及其热度,不仅可为相关科研人员的科学选题提供指导意见,也可为相关期刊的精准选稿提供决策支持。  相似文献   

5.
提出基于Prefuse的主题知识图谱系统框架,通过对信息检索领域的关键词进行共词分析、层次聚类和TreeML文件转换,实现信息检索主题知识图谱的构建。最终将信息检索研究划分为5个主题:智能化信息处理、搜索引擎相关、用户行为研究、信息系统研究和基于内容的信息检索研究。  相似文献   

6.
针对热点主题发现是在聚类算法的基础上实现的特点,将改进后的蚁群聚类算法引入到该研究中,同时提出类别关注度(CAD)的概念,以此来判定类别的热门程度并区分出热门类别和冷门类别,在此基础上抽取热点主题集。实验结果表明改进后的蚁群聚类算法对热点主题的发现有一定的效果,对其他仿生优化聚类算法的引入有借鉴意义。  相似文献   

7.
本文提出一种面向聚类主题的文本特征表示方法,即以聚类的主题概念来刻画文本的特征向量,将文本描述提升至语义层次.首先,通过聚类,形成一组以向量形式表达的隐含主题概念,再将基于词条空间的文本特征向量投影至这组主题概念,以隐含的主题概念来描述文本.实验分析表明,建立在概念空间之上的文本向量实质上是文本矢量与主题概念的关联度,能够突出表现文本内容的主题特征,更好地反映文本的语义内容,从而有效提高模型在文本检索与分类等领域的应用性能.而基于聚类形成的概念空间的维数由于可主观调整,又能有效地约减概念空间的维数,提高模型的应用实效.  相似文献   

8.
医学文献集合的主题抽取和主题聚类实践   总被引:1,自引:0,他引:1  
文献中的重要关键词能够反映其核心主题,因此对文献主题的发现和抽取问题就转化为对文献中的重要关键词集合的抽取.文章在调研了国外在主题抽取和聚类方面采用的技术方法的基础上,提出了在医学学科领域从文本信息资源中抽取主题并进行主题领域判断的技术方案,并详细阐述了其中的主题聚类的技术环节.为了验证该技术方案的有效性,文章以骨关节炎领域为例,对文中提出的技术方案进行实践验证.验证的结果表明文章提出的技术方案有着实际的有效性.该文为2008年第9期本期话题"知识抽取"的文章之一.  相似文献   

9.
为了弥补目前微博平台主题挖掘方法的不足,兼顾到微博信息的稀疏性、多维性、海量性等特点,提出根据微博信息特点进行有针对性的预处理后,使用基于先验概率的潜在语义分析模型LDA(Latent Dirichlet Allocation)进行微博主题挖掘,并在LDA建模的基础上,设计文本增量聚类算法,进一步实现主题结构的识别,从而使用户更好地理解主题及其结构。通过在真实微博数据集上的实验,证明该模型能有效进行主题挖掘和主题结构的识别。  相似文献   

10.
当前文本主题获取方法大多依靠单一关联分析,不能全面分析可获取信息,难以准确获取科技发展主题。科技文献的主题词、作者和引文之间蕴含了以研究主题内容为纽带的语义关联关系,主题词共现关系、引文关系和合著关系分别从不同的角度展现了主题关联关系。因此,本文根据主题词之间语义关系距离的远近,将主题识别中主题词关联分为基础关系、强化关系和新增关系,在此基础上提出面向主题识别的多元关系抽取及关系融合方法;并以基因工程疫苗的研发与制备领域为例进行领域实证分析,利用PathSelClus算法实现基于多元关系融合的主题聚类,通过对比实验证明多元关系融合可以有效提高实证领域的文本主题聚类效果,而未来多关系融合主题识别则是需要重点关注的问题。图4。表6。参考文献19。  相似文献   

11.
高校图书馆学科化服务探讨   总被引:3,自引:0,他引:3  
本文根据我国高校图书馆学科化服务发展现状,分析了学科化服务的薄弱环节,阐述了建立服务团队、提高服务能力、构建服务体系、制定考核机制、调整资源配置、建设资源库等措施,并提出了学科化服务平台的构建方案。  相似文献   

12.
以学科馆员为基点的一站式服务体系   总被引:1,自引:0,他引:1  
随着信息技术的迅速发展,当前高校学科馆员制度如何与现代信息技术和手段进行有机结合,成为数字环境下图书馆开展深层次知识服务的重要课题。文章对高校图书馆构建以学科馆员为基点的一站式服务体系进行了探讨。参考文献5。  相似文献   

13.
赵珊珊 《图书馆》2021,(2):90-95
新时代背景下,专题馆建设是促进高校图书馆的内涵建设、改革创新和服务转型升级的新途径。文章通过实地调研、文献分析和案例调查,归纳梳理了高校图书馆建设专题馆的成功经验。高校图书馆建设专题馆应遵循整体性原则,明确专题馆的发展定位,并寻求外部合作,利用多方资源合力开展建设。专题馆通过专题特色资源建设、空间再造、多元化服务等方式拓展服务边界,着力构建多元化的特色服务体系,并通过开展延展性活动来实现可持续发展。  相似文献   

14.
论数字图书馆专题资源库的建设   总被引:15,自引:0,他引:15  
数字图书馆资源建设的主要方式是共建共享。在合作建设、资源共享的模式下 ,服务对象的确定、专题的选择、总体设计以及相关标准与规范的确定是建设数字图书馆专题资源库的关键。图 3。参考文献 5。  相似文献   

15.
学科馆员制度范式演变及其挑战   总被引:60,自引:0,他引:60  
学科馆员制度的发展可分为两个阶段:基于传统图书馆的学科馆员制度范式(第一代),基于数字图书馆的学科馆员制度范式(第二代)。后者将对图书馆业务模式、信息服务方式等提出挑战。图3。参考文献20。  相似文献   

16.
基于QSIGsystem的数字图书馆学科门户体系建设与实践   总被引:3,自引:0,他引:3  
本文介绍了QSIGsystem系统和国内外数字图书馆学科门户体系建设的现状。分析了数字图书馆学科门户体系及其优势,并介绍了武汉理工大学数字图书馆学科门户体系建设的实践,为高校图书馆从事数字图书馆学科门户体系建设提供借鉴。  相似文献   

17.
主要介绍在机构知识库系统中集成开放知识组织引擎OpenKOS相关功能,利用OpenKOS的开放服务接口对机构知识库中知识产出进行主题标引和提供基于规范主题词的分面浏览,并实现对检索结果进行DDC聚类浏览的服务功能。系统投入应用后初步达到结合传统知识组织方式,对数字资源实现自动标引与自动分类的目标。  相似文献   

18.
建立网络社区主题通道的核心主题词表   总被引:1,自引:0,他引:1  
网络社区收藏的资源往往倾向于满足日常信息需要,涉及的主题范围比较专指,而传统的图书馆分类主题词表则倾向于学术性和综合性,不适于网络社区用户的需要,因此需要建立适于这些特定用户群的分类主题词表。本文作者曾经参与了一些数字化图书馆的项目,设计开发过一此专门用于这些目的的小型核心词表。这篇文章介绍了作者们在开发过程中遇到的一些问题以及解决这些问题的方法和策略。小型“核心”主题测表可以定义为为网络社区资源专用的主题分类表。通过对元数据记录中的主题词频统计分析,作者确定哪些是核心词,然后再将这些核心词分成网络、图书馆、机构组织和设施、图书馆类型、组织名称和服务、地名、一般主题词、和参考工具等8个大类。在这8个大类下再进一步细分到二级类目。本文展示了三个图书馆的实例,它们主要是为公共图书馆的用户设计的。通过解释他们在这三个项目中的做法,作者讨论了在开发过程中的技术和成本以及在维护方面的问题,并且比较了一些类似的词表。  相似文献   

19.
随着计算机网络技术的日益发展及其在各个领域中的大规模运用,作为新兴数据采集方式的自动识别技术得到迅猛发展。许多图书馆的借阅管理系统已淘汰以人工操作为主的传统借还图书模式,逐步采用完全依靠自助化的无线射频识别技术(RFID)来完成图书借还管理服务。笔者针对RFID自助服务模式对图书馆传统文献资源服务的冲击影响进行深入分析,以西华大学图书馆为例重点探讨重构和完善数字化背景下一种切实可行的“学科顾问”馆员文献资源服务结构,以及落实“学科顾问”馆员制度的详细执行方案和配套的勤工助学(学生工)推进措施等视角,就如何进一步改革和发展提出新的思路。旨在为提升和促进新型大学图书馆数字化文献资源服务转型提供参考和借鉴。  相似文献   

20.
通过对分校区图书馆的特征分析认为,协同校区图书馆、校区科研院所和校总馆等多方资源和力量开展学科服务是分校区深化学科服务的必由之路。具备层级特征和动态联盟特征的学科服务委员会和项目组的复合型组织形式和管理模式有利于多方资源的管理协同和服务创新,并通过复旦大学江湾校区的案例分析了该组织机制的适用性。参考文献11。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号