首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
[目的/意义]学术文献影响力评价指标不断推陈出新,但尚缺乏在研究主题层面对文献影响力的评价,为发现不同研究主题内具有高影响力和引用价值的文献,本研究给出一种基于研究主题的文献影响力评价方法。[方法/过程]以Web of Science数据库中2011年-2015年间情报学领域500篇高被引文献为样本,利用LDA模型对样本文献进行主题建模,将主题对文献的支持度与文献被引频次相结合,计算特定主题文献的被引频次(specific topic cited frequency,简称STCF),并根据每篇文献在相应主题内的STCF值对文献进行影响力排序。[结果/结论]结果表明,STCF值能反映文献的主题内容、细粒度体现文献的学术地位、呈现文献研究主题的多元性,能够有效弥补被引频次、Altmetrics指标的不足。  相似文献   

2.
基于自然语言词对法的文献主题新颖性探测研究   总被引:1,自引:0,他引:1  
[目的/意义] 提出一个全新的量化指标--文档主题新颖度,通过自然语言词对方法对文献主题内容的新颖性进行探测研究,并探讨其可行性和优缺点以及新颖度与F1000推荐文献和引文指标之间的关系。[方法/过程] 以F1000为基础,选取hematology主题近一个月内推荐的文献,在Pubmed中查找并获取该推荐文献发表之前6个月内密切相关的文献,构成整个文献集。定义自然语言法新颖度的概念、计算公式并利用Oracle数据库PL/SQL语言进行编程,通过MetaMap软件提取自然语言词汇进行文献主题新颖度的运算。[结果/结论] 自然语言法在文献主题新颖性探测的运算上具有一定的可行性;文档主题新颖度与F1000推荐文献、引用情况并非成等价关系,分属于科技论文评价的不同维度、不同范畴,不可一概而论。应将文档主题新颖度这一新指标与同行评议情况和文献计量学等其他相关论文评价指标结合起来对文献进行综合评价分析,选取优质文献给予推荐。  相似文献   

3.
[目的/意义] 针对单学科和双学科主题发现方法无法挖掘现有交叉文献中主题演化来源的问题,提出面向跨学科的主题发现方法,为跨学科发展和合作提供依据。[方法/过程] 首先在动物资源与育种领域期刊文献数据中选取已经出现交叉现象的两个基础学科文献及其交叉文献,使用改进的主题相关分析方法,提取共同主题和各自的独立主题;然后利用相关性测度方法量化不同学科独立主题的相关性;最后对共同主题和相似性较高的独立主题进行具体分析。[结果/结论] 在动物资源与育种领域的农学生殖生物学、兽医学以及其交叉文献上进行实验验证,结果表明所提出的方法能够有效发现交叉主题的学科出处。  相似文献   

4.
基于概率主题模型的文献知识挖掘   总被引:1,自引:0,他引:1  
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。  相似文献   

5.
阮剑  杨海霞  黄瑱 《情报工程》2017,3(4):039-047
大数据时代下,运用文本挖掘技术自动从海量科技文献中提取研究主题并探测研究趋势十分重要。基于LDA 主题模型,考虑科技文献的发表时间信息,对优秀“综合性科学技术”类大学学报2006-2014 期间刊载的计算机科学类文献进行主题内容和主题强度分析;同时基于计算机专业期刊文献,进行研究趋势探测。本文从25 个研究主题中得到7 个强度增强的研究主题和6 个强度减弱的研究主题,揭示大学学报文献中我国高等院校对计算机科学领域的研究状态。通过对数据进行挖掘和分析,了解我国高等院校在计算机科学研究领域的研究趋势,帮助从事该领域研究的学者寻找新兴研究主题,有助于大学学报在定向组稿和学术专辑出版中,把握学术热点与前沿方向,进而提高学报的影响力。  相似文献   

6.
基于电子图书与图书馆关系的研究   总被引:1,自引:0,他引:1  
钟健刚 《图书馆学刊》2010,32(6):107-109
运用文献计量学的方法,以《中文科技期刊全文数据库》为数据源,对电子图书与图书馆研究的文献从年度、期刊和主题3个方面进行了定量和定性分析,并对主题进行了综述,将电子图书与图书馆的相互关系展现出来,希望能对图书馆今后的发展提供一些有益的帮助。  相似文献   

7.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。  相似文献   

8.
以国内学术期刊1996年至2005年关于知识产权的研究文献为基础,以主题词、摘要和内容为依据,析出了关于知识产权的主要研究主题,并对主要的和显著增长的两类进行分析;以《中国期刊引文库》为基础,检索了被引用次数前10位的文献,并在此范围内分别从文献、学者、机构和期刊等方面进行了概述;最后,在对相关文献进行评述的基础上,提出了未来研究的建议。知识产权是一个广阔且极具价值的研究领域,与知识产权相关的有价值主题还很多,虽然近年也出现了对诸如知识产权价值、知识产权教育等有价值主题的研究,但从文献上来看,数量明显偏少,还有一些极具研究价值的主题明显研究薄弱;另外,就某一研究主题上来说,也存在研究不平衡与全面的问题。  相似文献   

9.
传统引文分析方法中,文献间的相互关系通常由引用关系决定,也就是说,如果文献A引用文献B,则证明B对A有一定的贡献,然而具体的贡献值与引用原因却很难进行界定。采用主题模型的方法,将原著、引文、被引文献看作是主题模型上的概率分布,通过全文抽取的方法,对引用的原因以及引文贡献值进行分析。首先介绍研究背景与研究意义,并对基本概念进行阐述;然后介绍引文抽取方法、 利用Labeled-LDA模型建立主题模型方法等;最后通过实验部分建立基于不同主题的文献引用网络图,并利用工具使其可视化表示。  相似文献   

10.
以ISI Web of science的人文艺术领域数据库A&HCI中2000-2011年的文献为数据来源,以中国和美国关于中国主题的研究文献为个案,对中美两国关于中国主题的研究文献从年发文量、文献类型、发文机构、期刊来源、学科类别、被引频次及施引文献情况等进行计量学的分析和比较,从而给予海内外中国主题研究以本土与域外的研究现状、"我者"与"他者"的研究视角以整体关照。  相似文献   

11.
1 分类检索途径的必要性 1.1 分类检索与主题检索 在文献检索过程中,根据文献的内容特征进行检索的途径主要有分类途径和主题途径.分类途径是从文献内容的学科类别角度进行检索;主题途径是从表达文献内容的主题词入手进行检索.  相似文献   

12.
由于医学文献的主要主题词和次要主题词在文献中所反映出的重要程度不同,因此在预处理过程中首将主要主题词和次要主题词进行加权处理.在主题速选阶段采用改进信息熵算法对主题进行遴选,最后利用词分析中的战略坐标分析对热点主题进行描绘.  相似文献   

13.
利用文献统计方法,对近8年来关于微软公司知识管理研究的文献数量、年代和主题情况进行了统计.通过对文献主题内容的分析,从基础研究、技术研究以及应用研究等方面对现有的研究成果进行了综述,并对未来研究做了展望.  相似文献   

14.
科学引文网络反映了科学知识的动态演化,作为一个复杂的网络系统已得到广泛研究。针对引文网络中主题不明确和热点问题不易跟踪的问题,提出了引文网络中的舆论评价计算方法和网络社区主题提取与表示方法。首先采用正则表达式和模板匹配方法提取元数据;并计算文献作者对参考文献的舆论评价,建立带有舆论评价权值的文献引用网络,并对网络中的突现语义进行描述;然后以此网络结构为基础,结合信息熵和网络中文献重要性权重改进TDIDF算法,计算得到每个社区主题的关键词概率描述,从而得到社区主题。本文的方法和实验对解释引文网络的演化、社区主题发现、文献的共享等有借鉴意义。  相似文献   

15.
在情报部门中,检索系统是打开知识宝库的钥匙,文献标引工作是制造这把钥匙关键性的工艺。文献的主题分析是对文献智力加工工艺中的最关键的环节。本文只从文献标引角度来论述主题分析的作用和方法。文献的主题分析,就是对文献的主题要素和隐含概念进行综合分析,以便确定主题的中心概念和从属概念,为正确地选择叙词奠定基础。标引工作的质量主要取决于主题分析的正确程度。主题分析错误或不当,主题标引  相似文献   

16.
以Web of Science数据库为文献来源,运用文献计量学方法并结合文献内容,从文献数量、文献类型与语种、核心作者、期刊、文献被引和主题等方面对h指数的研究论文进行分析,以期能对本领域今后的研究提供一定的参考与启示.  相似文献   

17.
为了适应科学技术的发展,许多图书馆、资料室都开展了主题标引工作,建立了主题检索系统。要想充分发挥检索系统的功能,提高检索效率,必须把住标引质量关,而正确选用主题词是提高主题标引质量的重要环节。如何正确地选取主题词?首先要对文献的主题进行分析。文献的主题分析,就是对文献的主题要素和隐含概念进行综合分析,以便确定主题的中心概念和从属概念,为正确地选取主题词奠定基础。主题分析是在阅读文献的题名、摘要、序言乃至浏览全文的  相似文献   

18.
引文主题与源文献主题具有相关性.基于这一事实,本文提出了一种基于汉语科技文献引文的自动标引法.具体过程是以词典为依据对源文献与引文题名进行抽词处理,并为不同类型引文赋予不同的权重,在此基础上确定用于标引源文献的关键词.本文还对此法的可行性进行了测试,并提出了改进方法.  相似文献   

19.
胡军 《图书馆界》2011,(6):48-51
针对2005-2010年在期刊和报纸上发表的有关“农民工与图书馆”的文献,从文献来源数据库分布、年代分布、刊物类型分布、文献作者的地区分布、文献作者的机构分布、文献的基金论文分布、高频被引论文分布和文献的主题分布进行了统计分析,揭示了这一主题研究的现状。  相似文献   

20.
1994-2004年我国竞争情报文献内容分布实证   总被引:2,自引:0,他引:2  
以维普资讯中文科技期刊数据库1994-2004年间核心期刊所载竞争情报论文题录、中国科学技术情报学会竞争情报分会(SCIC)第四届(1997年)至第十届(2004年)年会会议资料以及因特网上关于竞争情报相关主题的文献报道为分析材料,对我国竞争情报文献内容的主题分布进行探索性分析,并对竞争情报主题分布与文献类型、学科专业及年代之间的相关性进行检验。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号