首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 287 毫秒
1.
基于被引次数的引文分析无法直接揭示论文的研究内容,利用关键词或从标题、摘要和全文中抽取的主题词很难客观反映论文的被引原因。本文以碳纳米管纤维研究领域的高被引论文为研究对象进行引文内容抽取和主题识别,经人工判读验证:基于引文内容分析的高被引论文识别的核心主题能够较好地揭示高被引论文的被引原因(引用动机),而且与论文的研究内容相符合;与基于全文、基于标题和摘要的主题识别相比,在引文内容分析基础上识别的主题具有更好的主题代表性,能够有效揭示被引文献的研究内容,是对原文相关信息的重要补充。本文的实验表明基于引文内容分析的高被引论文主题识别是可行而且有效的。图4。表4。参考文献31。  相似文献   

2.
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性.  相似文献   

3.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

4.
认为利用专利技术功效主题词与专利引文进行共现分析可直观识别核心专利簇的技术功效特征。与专利引文共现分析相比,专利技术功效主题词与专利引文的交叉共现增加了主题标识,使得基于相同标引主题词的被引专利有相似的技术主题和功效特征。同时,不同的技术功效主题词通过专利引文交叉共现,可以识别不同技术主题的关联度以及技术主题对应的功效特征。最后,选择医用显微内窥镜领域相关专利做实证分析,通过技术功效主题词-专利引文、技术主题词-专利引文以及专利引文共现分析,论证专利技术功效主题词与专利引文共现方法在核心专利挖掘方面的特征、优越性及不足。  相似文献   

5.
力学各分支学科研究前沿和发展趋势的可视化分析   总被引:4,自引:0,他引:4  
科学知识可视化是在信息技术推动下发展出来的一个新领域.本文以流体力学、固体力学、计算力学和振动力学领域的14种国际代表性期刊10年间的论文为研究对象,通过CiteSpace软件对引文数据和主题词数据的分析和处理,生成共被引文献网络和施引文献主题词共词网络组成的共被引与共词的混合网络图.以知识图谱的方式展示了力学各分支学科的重要被引文献、主要学术人物以及由施引文献主题词所表达的力学重要研究领域,揭示了力学各分支学科的演化过程、研究热点和前沿发展趋势.并深入剖析了支撑当前力学发展的由20世纪所形成的知识基础.  相似文献   

6.
利用遗传算法确定医学文献的研究热点   总被引:3,自引:0,他引:3  
提取医学文献的主题词特征向量,检索文献在发表两年后的最新被引次数,以此作为热点文献的指标,利用遗传算法编程,优化提取出能表达热点文献内容的主题词组合。以肿瘤干细胞为测试对象,以词频分析所得的结果作为基准线,并请相关领域专家对两组结果进行评价比较,结果显示遗传算法所得到的结果优于词频分析。  相似文献   

7.
马晓雷  文秋芳 《图书情报工作》2011,55(4):110-113,137
被引内容指的是被引用文献在引用文献中被引述的具体内容。Small曾经指出被引内容的研究价值,但迄今为止,在文献计量学领域被引内容分析仍然没有广泛展开。针对这一情况,提出一种分析领域知识的新方法———基于文本聚类的被引内容分析法,这种方法可以在一定程度上解决引文分析存在的问题。以第二语言教育为分析领域,研究结果证明该方法的可行性以及被引内容的研究价值。  相似文献   

8.
基于CSSCI的中国社会科学文献引文实证研究   总被引:7,自引:0,他引:7  
文章以CSSCI为统计源,基于1999-2006年CSSCI数据库收录论文的引文情况,分别对篇均引文、篇均被引、各类文献被引、自引、各年文献被引、文献半衰期及期刊论文被引频次进行了计量统计分析,研究并探讨了近8年社科文献自身的发展状况及其发展规律.  相似文献   

9.
面向引用关系的引文内容标注框架研究   总被引:3,自引:0,他引:3  
引文内容分析能够帮助揭示文献引用关系的深层语义内涵。本文梳理了目前已有的引文内容标注体系,归纳出构建引文分类体系的三个主要维度,即引文功能,引文重要性,情感倾向。以支持文献引用关系分析为目标,针对引文内容分析设计出一个引文内容标注框架,其中包括揭示引文关系抽象性质的引文分类标注体系,描述被引文献具体内容的引用对象标注体系,以及记录引文客观特征的引文属性标注体系。具体的标注实验体现了该标注框架的可用性。图1。表6。参考文献56。  相似文献   

10.
论“引文耦合”与“同被引”   总被引:3,自引:0,他引:3  
科学文献的引用与被引用,使得大量文献分群聚类.引文聚类包括“双引”、“三引”以及三引以上的引文聚类.科学文献的双引聚类分析涉及两个最本的概念:“引文耦合”与“同被引”.对“引文耦合”与“同被引”的分析研究,是文献计量学的重要内容之一.本文主要讨论这两种引文聚类关系的广义概念、分析方法及其意义. 一、“引文耦合”与“同被引”的概念在科技文献的引文中,人们经常可以看到不同文章的作者在不约而同地引用某篇或某几篇完全相同的文献.针对这种现象,美国学者开斯勒(M·M·Kessler)博士于1963年首次提出  相似文献   

11.
[目的/意义]论文被引频次只能反映论文的宏观影响力,无法揭示论文在他人研究中的具体作用和影响,因此,本文提出从引用内容的主题和功能两方面对论文的影响力进行分析。[方法/过程]以2014年诺贝尔生理学或医学奖获得者J.O'Keefe的高被引论文为实例,首先,采用文献计量学方法对引用内容主题进行分析;对其,影响范围及领域进行可视化分析;其次,从引用性质和功能角度,将引用内容分成正面引用、负面引用和中性引用;最后,将中性引用进一步划分为3类,分别是研究背景介绍、理论基础和实验基础。[结果/结论]结果表明,共词分析可以很好地表达论文影响的主题领域;引用内容的分类可以提供一篇论文被引用的多方面原因。在本实验中没有负面引用,多于10%的引用为正面引用,大约50%的中性引用都是作者在研究背景章节中介绍与施引文献相关的研究工作。  相似文献   

12.
[目的/意义]从内容差异来探索论文未被引规律,不仅是论文未被引现象研究的重要内容,也有利于扩展基于内容的引文分析方法范畴。[方法/过程]以CSSCI作为来源数据库,以图书馆情报与文献学为样本学科,依据该学科学者的h指数分布特征随机选择200名学者作为样本对象,下载其1998-2015年的所有被收录论文数据;下载样本学科1998-2015年的所有收录论文数据,并离析出对应被引论文、高被引论文的相关数据;以6年为时间窗口,将发表后1-3年内被引的论文定义为被引论文,其余的为未被引论文;析取未被引论文、被引论文、学科整体论文及高被引论文的关键词,按关键词频数从高到低排序,选取排序前50的关键词构成关键词向量,计算关键词向量的内积、欧几里得长度和余弦相似度。[结果/结论]图书馆情报与文献学领域在21世纪初形成较为稳定的研究内容体系,其未被引论文与学科整体论文、被引论文、高被引论文的内容相似度都较低,表明研究内容对论文未被引有重要影响。  相似文献   

13.
Predicting the citation counts of academic papers is of considerable significance to scientific evaluation. This study used a four-layer Back Propagation (BP) neural network model to predict the five-year citations of 49,834 papers in the library, information and documentation field indexed by the CSSCI database and published from 2000 to 2013. We extracted six paper features, two journal features, nine author features, eight reference features, and five early citation features to make the prediction. The empirical experiments showed that the performance of the BP neural network is significantly better than those of the six baseline models. In terms of the prediction effect, the accuracy of the model at predicting infrequently cited papers was higher than that for frequently cited ones. We determined that five essential features have significant effects on the prediction performance of the model, i.e., ‘citations in the first two years’, ‘first-cited age’, ‘paper length’, ‘month of publication’, and ‘self-citations of journals’, and the other features contribute only slightly to the prediction.  相似文献   

14.
[目的/意义]借助引文分析与其他文献计量学研究方法对特定领域的"研究前沿"进行分析,是目前情报学研究的重要课题。但是中文"研究前沿"实际对应于Research Front与Research Frontier两个具有不同内涵的英文术语,厘清这两个术语关系有助于学者改进并正确应用"研究前沿"分析方法。[方法/过程]在分析Research Frontier与Research Front两个概念交集关系模型的基础上,以Scientometrics和JASIST两种期刊为样本,检验了常见Research Front引文分析指标的可靠性。[结果/结论]实证研究结果显示,尽管高被引论文比零被引在引文的新颖性、热点性、耦合关联性上具有相对显著的优势,但这些特征指标并不能高效地映射潜在的高被引论文。因此,Research Front与Research Frontier是具有显著差异的不同概念,学者们应该对这两组概念进行更为深入的讨论。  相似文献   

15.
Objective:This study compares two maps of biomedical sciences using Medical Subject Headings (MeSH) term co-assignments versus MeSH terms of citing/cited articles and reveals similarities and differences between the two approaches.Methods:MeSH terms assigned to 397,475 journal articles published in 2015, as well as their 4,632,992 cited references, were retrieved from Web of Science and MEDLINE databases, respectively, which formed over 7 million MeSH co-assignments and nearly 18 million direct citation pairs. We generated six network visualizations of biomedical science at three levels using Gephi software based on these MeSH co-assignments and citation pairs.Results:The MeSH co-assignment map contained more nodes and edges, as MeSH co-assignments cover all medical topics discussed in articles. By contrast, the MeSH citation map contained fewer but larger nodes and wider edges, as citation links indicate connections to two similar medical topics.Conclusion:These two types of maps emphasize different aspects of biomedical sciences, with MeSH co-assignment maps focusing on the relationship between topics in different categories and MeSH direct citation maps providing insights into relationships between topics in the same or similar category.  相似文献   

16.
In this paper, we discussed the feasibility of early recognition of highly cited papers with citation prediction tools. Because there are some noises in papers’ citation behaviors, the soft fuzzy rough set (SFRS), which is well robust to noises, is introduced in constructing the case-based classifier (CBC) for highly cited papers. After careful design that included: (a) feature reduction by SFRS; (b) case selection by the combination use of SFRS and the concept of case coverage; (c) reasoning by two classification techniques of case coverage based prediction and case score based prediction, this study demonstrates that the highly cited papers could be predicted by objectively assessed factors. It shows that features included the research capabilities of the first author, the papers’ quality and the reputation of journal are the most relevant predictors for highly cited papers.  相似文献   

17.
基于收录高水平论文的ESI数据库,对首批“985”高校入选的基础学科进行分析对比,从其入选学科及学科整体在世界范围的学科引用排名情况,以及论文收录、篇均被引、高被引论文等量化数据来分析,且与美国早期8所常春藤高校的相应指标进行对比,客观评价其学科研究特点和学术影响力,并为“世界一流”大学的建设提出建议。   相似文献   

18.
李根 《编辑学报》2018,30(2):178-180
为深入把握研究前沿,并了解其中高被引论文的特征,以ESI 数据库中(数据截至2017 年6 月底) 全球最受关注的前10 位(TOP 10) 研究前沿中的高被引论文(共计486 篇) 为样本,利用Excel 2010 对其涉及学科、来源期刊特征、作者地域分布3 个方面进行了统计分析,希望能为国内期刊在追踪前沿学术论文,以及提升论文影响力方面提供参考.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号