首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 166 毫秒
1.
[目的/意义] 概率主题模型算法在不断得到改进与扩展,本文对国内外已有的利用引文构建的主题模型进行研究,分析和对比不同模型的生成过程与算法,并探讨利用引文构建的主题模型在科技文本分析中的应用与可扩展的研究方向。[方法/过程] 通过Web of Science数据库和CNKI数据库获取国内外利用引文构建主题模型的相关文献,经人工判读后筛选出具有代表性的文献,对这些文献中利用引文构建的主题模型,从建模思想、生成过程、参数估计与推断算法等方面进行对比与分析。[结果/结论] 目前国内外利用引文构建的主题模型主要包括研究主题与引文分布的主题模型、研究被引与施引主题间关系的主题模型,以及基于引用内容的引用主题模型;主题模型中引入引文信息后,能够获得更完整的主题内容和特定主题下的重要文献,并可识别施引文献和被引文献之间主题间的关系及影响;已有的模型多集中在概率潜在语义分析(Probabilistic Latent Semantic Analysis,PLSA)和潜在狄利克雷分配(Latent Dirichlet Allocation,LDA)主题模型基础上进行扩展。未来可扩展研究引入引用内容的主题模型、模型的性能优化和评价方法、模型的应用研究等。  相似文献   

2.
[目的/意义] 对学术论文引用预测影响因素和预测方法进行梳理,分析现存问题并提出发展方向。[方法/过程] 采用文献调研法,综述国内外研究进展,总结预测影响因素和预测方法的相关内容和特点。[结果/结论] 现有影响因素指标繁多,无统一标准;预测方法理论基础薄弱;引文预测动态性研究不足;预测模型通用性受限。未来应加强引文预测的理论研究、加强传统文献计量和替代计量的结合、加强自然语言处理的深度应用、建立统一的基线标准、构建更加精准的预测模型。  相似文献   

3.
[目的/意义] 将引用内容分析与引文著录分析进行比较,旨在引起国内学者、出版商、图书馆、信息服务等相关人员和部门对引用内容研究的关注,促进引文分析理论和实践的全面发展。[方法/过程] 首先对引文著录与引用内容的相关概念进行分析,然后从引用频次的计算、引用极性的分类、引用动机的分析、引文网络中文献之间的关系、应用发展5个角度将引用内容分析与引文著录分析进行比较,得出引用内容分析相对引文著录分析的优势所在。[结果/结论] 与引文著录分析相比较,引用内容分析在科学评价和揭示科学技术发展的特征方面更合理,是引文著录分析的有力补充。  相似文献   

4.
[目的/意义] 针对60年间作者引用行为演变的分析,了解引文评价的局限性,促进学术论文评价方法的发展和完善。[方法/过程] 通过对1957-2017年物理学和哲学代表性期刊的280篇论文的3 314条参考文献和5 222次引文进行识别,判断和统计其在不同年代的引用特征,并讨论引用行为的演变趋势对引文评价的可能影响。[结果/结论] 通过调查发现如下结论:一是期刊论文在参考文献载体类型和年代分布上没有明显变化,但在篇均参考文献量、参考文献文内平均被引用次数、论文的引用认同和引用深度等方面存在明显变化趋势;二是引用行为的变化,使得引文分析作为学术论文评价的依据受到质疑。论文篇均参考文献量的增长以及深度引用与负面引用比重的下降,使得引文评价的参考性减弱。  相似文献   

5.
张娴  方曙 《图书情报工作》2016,60(20):140-148
[目的/意义] 对现有专利引用网络主路径方法研究内容进行总结梳理,为今后应用该方法解决技术演化进程中的关键性专利技术识别和主流线索提取提供理论支撑。[方法/过程] 系统梳理相关研究成果,从算法研究、应用研究、方法优化扩展研究三个方面总结现有研究内容与特点,分析当前研究的局限性,探讨未来研究发展方向。[结果/结论] 当前研究的主要局限性在于:对路径发展驱动力的多元性与系统性揭示不够、忽视不同引证关系对路径演化的影响差异性、对演化的动态性关注不足、多主路径方法本质上仍属单目标搜索。未来研究将关注以下几个方向:对算法思想进行实质性与创新性拓展、更强调动态性与未来预测性、优化计算效率以增强适用性与实用性、发挥专利引用主路径在产业化扩散研究中的独特优势。  相似文献   

6.
丁敬达  郑巧  刘超 《图书情报工作》2021,65(11):143-152
[目的/意义] 梳理软件引用及其规范的理论和实践现状,分析存在的困难和问题,促进软件引用规范和标准的建立。[方法/过程] 通过文献调研,得出软件引用面临接受文化、奖励制度、引用认知和元数据4个方面挑战,分析国内外为应对挑战对软件引用及其规范的理论探索和实践进展。[结果/结论] 软件引用利益相关者分析、软件引用原则和元数据标准等理论探索以及国际研究组织和社区的引用指南、相关项目和知识库的支持、人员培训、贡献分配和奖励计划的实施、软件引用文件的提供等实践为软件引用规范的建立奠定了良好的基础,但尚需软件引用利益相关者通力协作、共同克服面对的困难和挑战。S  相似文献   

7.
丁文姚  李健  韩毅 《图书情报工作》2019,63(22):118-128
[目的/意义] 探索期刊论文科学数据引用特征与规律不仅有助于描述学科领域对科学数据的利用情况,还能够揭示学术成果表达中的数据引用模式。[方法/过程] 以我国图书情报领域6种期刊2017年与2018年第一期刊载论文为样本,结合国家标准《信息技术科学数据引用》的引用元素,采用内容分析法从9个维度对样本论文的科学数据引用行为进行数据编码,应用统计学方法描述图书情报领域期刊论文科学数据引用特征并探索不同维度特征间的关联关系。[结果/结论] 图书情报领域期刊论文广泛引用来自国内外的统计整理类科学数据,对期刊论文中个人研究科学数据的引用量较大;科学数据引用标注方式与科学数据类型存在一定对应关系,但多样化的标注方式缺乏统一性;二手引用现象较为突出,二手引用程度与科学数据创建者类型相关。  相似文献   

8.
基于引文内容分析的引用情感识别研究   总被引:1,自引:0,他引:1  
[目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。  相似文献   

9.
学术文献引文推荐研究进展   总被引:1,自引:0,他引:1  
[目的/意义]学术文献引文推荐是指对于给定的学术文献,自动化地为其推荐合适的引文和参考文献。借助于引文推荐,用户可以在一定程度上提高撰写学术文献的效率,降低对重要相关文献的漏引。[方法/过程]分析国内外引文推荐研究的最新进展,阐述引文推荐问题的演化过程,从局部引文推荐和全局引文推荐等方面对引文推荐进行梳理,重点归纳文档相似性、主题模型、翻译模型、协同过滤和混合推荐等5种引文推荐常用方法,并总结引文推荐常用数据集和测评方法。[结果/结论]已有引文推荐研究的主要问题在于未考虑用户偏好的动态变化性及研究领域的综合性,在用户研究和实际应用方面仍有所欠缺;未来引文推荐的研究可运用语义化表达方法和自然语言生成技术,从基于上下文的引文推荐和跨语言引文推荐等方面进行展开。  相似文献   

10.
[目的/意义] 研究专利引文形成的路径是合理评估数据样本的重要基础,也是建立研究假设和研究模型的重要前提。[方法/过程] 以行为逻辑为视角,从专利引用行为的主体、动机、行为能力和外部的引用行为规则4个因素对专利引文的形成路径进行研究。[结果/结论] 行为主体经历心理阶段和实施阶段,在外部规则因素的作用下形成专利引文。专利申请主体的因素是导致引用动机和引用行为差异的主要原因,进而导致专利引用结果的差异,构建样本和模型时应对不同属性的主体的引文作出区分。  相似文献   

11.
��[Purpose/significance] This paper summarizes the influencing factors and prediction methods of academic paper citation, analyzes the existing problems and proposes the future development directions.[Method/process] This paper used the literature research method to review the research progress of academic papers at home and abroad, and summarized the relevant content and characteristics of influencing factors and prediction methods.[Result/conclusion] There are many indicators of influencing factors, but there is no unified selection criteria. The theoretical basis of prediction methods is weak. The research on dynamics of citation prediction is insufficient. The generality of prediction models is limited. In the future, we should strengthen the theoretical research of citation prediction methods, the combination of traditional bibliometrics and alternative metrics, the deep application of natural language processing, and establish a unified baseline standard, a more accurate prediction model.  相似文献   

12.
宗张建 《图书情报工作》2019,63(16):132-142
[目的/意义]睡美人文献是一类蕴藏着巨大科学价值的文献。对国内外睡美人文献识别方法的相关研究成果进行总结与梳理,形成比较完整的综述内容,为国内该领域研究提供参考与借鉴。[方法/过程]按方法属性将识别方法总结为4类,概括各识别方法的基本思路、识别标准、优点及局限性,并参照睡美人文献识别方法的4条原则进行对比,指出各识别方法的适用范围。[结果/结论]睡美人文献识别方法已由单一逐渐丰富,从主观参数向客观指标演变,从单一引文曲线向多种形式曲线并用发展。未来睡美人文献识别研究可从睡眠深度标准再定义、识别方法再组合上深入。此外,还需重视睡美人文献的定性研究和识别方法的验证性研究,重视睡美人引文价值的测度以及预测性研究。  相似文献   

13.
学术文献引文上下文自动识别研究   总被引:2,自引:2,他引:0  
[目的/意义] 引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法/过程] 梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果/结论] 实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。  相似文献   

14.
[目的/意义] 对引文文本分类的标准、实现方法和应用进行梳理,分析存在的问题,提出可改进的方向。[方法/过程] 总结目前引文文本分类的几个重要角度,如基于引用功能、基于情感倾向、基于引文影响力等,对引文文本分类的实现方法进行比较,分析其优缺点。[结果/结论] 目前引文文本没有统一的分类标准和实现方法,引文文本的获取较为困难,计算机分类算法准确率较低,中文引文文本分析文献少。未来研究思路和方向应该是:统一文本分类的标准,提高引文文本计算机处理技术的准确性,扩大应用范围。  相似文献   

15.
[目的/意义]论文被引频次只能反映论文的宏观影响力,无法揭示论文在他人研究中的具体作用和影响,因此,本文提出从引用内容的主题和功能两方面对论文的影响力进行分析。[方法/过程]以2014年诺贝尔生理学或医学奖获得者J.O'Keefe的高被引论文为实例,首先,采用文献计量学方法对引用内容主题进行分析;对其,影响范围及领域进行可视化分析;其次,从引用性质和功能角度,将引用内容分成正面引用、负面引用和中性引用;最后,将中性引用进一步划分为3类,分别是研究背景介绍、理论基础和实验基础。[结果/结论]结果表明,共词分析可以很好地表达论文影响的主题领域;引用内容的分类可以提供一篇论文被引用的多方面原因。在本实验中没有负面引用,多于10%的引用为正面引用,大约50%的中性引用都是作者在研究背景章节中介绍与施引文献相关的研究工作。  相似文献   

16.
[目的/意义]对引文分析领域的研究与创新进行回顾和展望。[方法/过程]运用隐喻思维方法,以"科学睡美人"和第二代期刊评价指标(EF和SJR)的创设为例,对引文分析领域取得的主要研究进展进行说明;同时,通过对生态学相关研究文献的调研分析,提出将生态学原理引入到未来引文分析研究中来,形成一个新的研究方向——引文生态学,并就若干重要研究议题进行简要说明。[结果/结论]隐喻思维方法在学术研究及方法论创新中具有重要作用,引文生态学的提出对引文分析领域的理论完善和应用创新具有重要价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号