首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
文章通过对我国信息资源管理学科及其邻近学科新兴主题的识别研究,为我国信息资源管理学科领域学者提供研究方向,并为信息资源管理学科与邻近学科开展合作研究提供思路,助力信息资源管理学科守正创新、挖掘学科内在发展机制、支撑科技战略决策和前瞻学科应用价值。首先以CJFD中“图书情报与数字图书馆”类文献作为信息资源管理学科研究对象,将与该学科同属于一级类目“信息科技”下的其他9个二级类目作为信息资源管理邻近学科纳入研究对象;检索CJFD中这10个学科自2012年至今的高影响力文献,并提取关键词。然后选用AP算法对关键词进行主题聚类,利用灰预测模型自建新兴主题探测指标,识别信息资源管理学科新兴主题;自建主题友好度指标,识别信息资源管理邻近学科友好型新兴主题。最终模型识别并验证得出5个信息资源管理学科新兴主题:在线健康社区、信息资源管理学科建设、公共文化服务、学术影响力、数字记忆;在此基础上得到邻近学科中与信息资源管理学科有高友好度的5个邻近学科友好型新兴主题:机器学习、数字治理、融媒体、学术期刊与新媒体、数智赋能。  相似文献   

2.
[目的/意义]面对世界范围内各种思想文化交流、交融、交锋的新形势,深入挖掘国际传媒研究热点,对促进我国传媒领域的学术发展与学科体系完善具有重要意义。[方法/过程]本文以Web of Science数据库中2015—2019年传媒类期刊文献数据为基础,结合概率主题模型、文献计量方法以及自然语言处理技术对文档内容和元数据进行联合建模,构建国家-主题分布矩阵,较为全面地挖掘了近五年来国际传媒研究的地理分布与知识结构,最终落脚于国内传媒领域研究的热点主题分析。[结果/结论]研究结果表明,数字技术推动新媒体蓬勃发展,不断刺激传媒领域的产业升级与文化重塑。我国部分主题在理论研究、产学交流、学科融合等方面仍存在探索与提升的空间,需要在重视理论研究与应用研究、基础学科与新兴学科协同发展的基础上,开展符合国内需求、具有国际视野的传媒研究,为传媒领域的持续深入发展添砖加瓦。  相似文献   

3.
基于概率主题模型的文献知识挖掘   总被引:1,自引:0,他引:1  
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。  相似文献   

4.
[目的/意义]潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)在科技情报分析中用来发现学科主题、挖掘研究热点以及预测研究趋势等。对常见的科学文献文本语料库(关键词、摘要、关键词+摘要)进行LDA主题抽取效果的评价,以揭示不同语料库的主题抽取效果,提高LDA在科技情报分析中的应用效果。[方法/过程]对上述3种语料库下的LDA主题模型进行对比研究,采用基于查全率、查准率、F值以及信息熵的定量分析和基于主题抽取的广度和主题粒度的定性分析相结合的方法对主题抽取效果进行评价。[结果/结论]通过国内风能领域的科学文献数据实证研究发现,无论是从定量分析还是从定性分析来看,摘要和关键词+摘要作为语料的LDA主题抽取的效果均优于关键词作为语料的LDA主题抽取效果,并且前者在主题抽取的广度方面表现更好,而后者抽取的主题粒度更细。  相似文献   

5.
以 CNKI 期刊全文数据库中近十年以来科学数据领域发表的期刊论文作为数据基础,在对关键词进行一定程度人工干预的基础上,采用共词分析法探究我国科学数据的研究主题。结果表明,2003年至2013年科学数据的研究主题集中在8个方面:科学数据共享和数据共享平台、科学数据组织与分类、科学数据监护与服务、科学数据整合、科学数据政策与开放获取、科学数据网格技术、科学数据挖掘和科学数据管理。  相似文献   

6.
如何借助于有效的方法和途径在大量文献数据基础上对学科主题进行深入和精准的探测和跟踪,是以情报学科学计量领域为核心、不同学科共同致力突破的热点和前沿研究问题。相关方法和途径主要涉及频次视角、内容视角、引证视角以及融合视角等四个视角。本研究试图结合近年来发表于国际国内重要期刊有关学科主题探测和演化分析的最新文献,对相关视角的主要进展进行述评,归纳总结不同视角的实现路径和机制,指出已有视角可能存在的知识单元或者网络关系的异质重要性偏差问题、知识的时间衰变以及新兴主题特征的小样本弱势问题、主题自然发育和进化的拟合困境、微观层面的知识流动和变迁刻画问题等,特别地,为融合视角这一总体趋势指明方向。  相似文献   

7.
[目的/意义]研究前沿的准确判断是国家宏观层面的战略需求,文献计量学作为一种定量研究方法广泛应用于科学主题探测和研究前沿识别中。[方法/过程]梳理研究前沿主题探测的发展历程和方法模型,引入全域微观模型的概念,详细介绍SciVal模块采用的主题创建方法,包括直接引用文献聚类、关键词主题命名和研究前沿遴选的主题显著性算法,并对SciVal创建的9.6万个主题和遴选出的前1%的研究前沿主题的特征进行实证分析。[结果/结论]全域微观模型可以同时一次识别整个科学领域的所有主题,但不同学科在研究前沿上表现存在差异,不能把主题显著性简单等同为重要性;主题论文数量与主题排名之间存在中度相关性;自动抽取的关键词术语从学科领域层和独特性上命名和描述主题;石墨烯相关前沿主题的演变趋势分析可以用于发现关键节点和新兴主题。  相似文献   

8.
为探究面向学科新兴主题探测领域多源科技文献融合过程中的时滞性问题,本文设计了多源科技文献时滞计算方案。首先,从获取的4种科技文献数据集中提取学科主题,计算学科主题间的相似度,构建相似矩阵;其次,基于匈牙利最优匹配算法寻求相似度损耗最小条件下的最优组合;最后,构建线性方程模型并拟合计算时滞程度。本文以2009-2016年农业学科领域337790篇摘要文本为实验数据,抽取基金项目文本学科主题为250个、专利文献为260个、期刊论文为260个、会议论文为240个,利用上述多源科技文献时滞计算方案实验。结果表明:期刊论文滞后于基金项目文本和会议论文1年,专利文献滞后于期刊论文1年,结合以往对不同学科领域数据的研究结果,验证了多源科技文献时滞计算方案的可行性和有效性,同时也为多源科技文献融合策略的制定提供新思路。  相似文献   

9.
[目的/意义]为全面、客观、高效、直观地掌握科技领域主题的发展规律和演变趋势,提出一种基于多源数据的领域主题演化路径识别和分析框架。[方法/过程]获取不同来源的科技文献数据,利用多维样本有序聚类方法辅助时间切片,基于改进的词袋构建方法,提升LDA模型主题识别效果,借助Louvain社区发现算法在主题层进行多源数据的融合,分析领域主题演化路径。[结果/结论]利用美国太赫兹研究领域基金项目、论文和专利3种来源的数据进行实证研究,结果表明,3种数据源能够清晰划分出4个时间窗口,改进的词袋构建方法能够表征更准确的领域信息内涵,主题社区有助于从多源数据复杂的演化网络中厘清主题演化脉络。  相似文献   

10.
基于主题模型的科技报告文档聚类方法研究   总被引:1,自引:0,他引:1  
[目的/意义]探索实践以科技报告为文献载体形式的融合主题模型的文本聚类方法,拓展基于科技文献进行技术监测服务的新领域,提出基于科技报告进行语义分析的新方法。[方法/过程]以国家科技报告服务系统中的科技报告为数据源,首先基于LDA主题模型对经过文本预处理的科技报告进行主题挖掘,再基于Ward与K-means相结合的聚类算法对包含主题分布信息的文本向量进行聚类分析,尝试提出一种适合科技报告文档聚类的文本挖掘新方法。[结果/结论]实验结果表明,LDA主题模型能有效准确挖掘科技报告中的主题信息,所提出的Ward与K-means相结合的聚类算法对科技报告的聚类效果也优于其它传统聚类算法。  相似文献   

11.
针对现有主题排序偏主观、高维数据复杂难处理等问题,提出一种基于近邻传播聚类和天际线算法的主题排序方法。结合关键词重要性和近邻传播聚类算法自适应获取文献初始核心主题,借助平均相似性系数进一步对初始主题簇进行二次近邻传播聚类。以簇中心代表关键词的篇均被引量和篇均下载量为主题热度表征指标,利用天际线算法获取主题天际线集合,通过主成分分析法实现主题排序。对中国知网2010—2020年与供应链相关的期刊文献进行数据处理和挖掘时发现,本文提出的新方法可以有效地识别供应链领域研究主题及其热度,不仅可为相关科研人员的科学选题提供指导意见,也可为相关期刊的精准选稿提供决策支持。  相似文献   

12.
王平 《图书情报工作》2014,58(22):70-77
自动挖掘科技文献主题并识别主题变化对于科研工作者及时获取相关领域的最新研究动态有着重要作用.针对科技文献主题多样、动态性强等特点,分析科技文献主题发现及演化具体方法,基于层次概率主题模型hLDA,采用Gibbs抽样来进行模型参数估计,并运用互信息的方法对主题词进行筛选,以提取高质量的主题词.最后,利用先/后离散分析方法研究主题随时间的演化问题.实验结果验证了主题发现及演化方法的可行性及有效性.  相似文献   

13.
[目的/意义]主题演化对科技前沿探测、创新战略部署具有十分重要的作用。[方法/过程]将主题演化分析过程分解为主题的表示、相似性关联和强度演化计算几个步骤,提出一种主题强度演化与预测模型,使用LDA模型进行主题的表示,提出内容、共现和趋势相似度等维度进行主题关联计算,引入基于Prophet的预测-修正模型进行主题演化趋势预测。并以干细胞领域为例,进行演化的实证分析。[结果/结论]实验表明,对每个研究主题采用Logistic增长模型进行预测R2Score都达到0.90以上,表明Prophet的Logistic增长模型与该领域主题增长趋势规律相符合,能够较好地拟合主题强度的演化趋势。提出的主题演化模型对专业领域内主题分布与演化分析有一定的借鉴意义。  相似文献   

14.
探讨如何利用论文关键词共现和聚类的方法探测和确定科研机构的研究主题。提出从主题覆盖范围、主题研究强度、主题研究影响力3方面综合测度和分析科研机构的研究主题分布、重点研究主题和优势主题等情况。在关键词共现和聚类的基础上,引入关键词词频和被引次数,将机构的研究主题分布、研究强度和影响力等情况更加形象地展现出来,并以我国具有情报学博士学位授予点的9所图书情报机构为例,实证分析各机构在情报学领域的研究主题分布情况、主要研究主题领域和优势主题领域。  相似文献   

15.
祝娜  王芳 《图书情报工作》2016,60(5):101-109
[目的/意义]科技创新需要快速发现特定科技领域中关键知识衍生与演化的路径,探索未来的知识创新趋势,为此,有必要对知识演化路径进行动态可视化研究。[方法/过程]从主题关联的角度入手,以3D打印领域为例,基于LDA识别出科技创新主题并进行分阶段细化分析,探测主题集群内部与外部的关联强度,识别出主题不同生命周期的演化能力及其演化类型。[结果/结论]实验结果表明,该方法从主题关联的角度入手,构建了基于时间序列的知识演化路径,丰富了知识管理和信息计量的理论研究方法,在实践上则有助于探测科技创新知识。  相似文献   

16.
针对学科领域中热点研究主题探测,尝试综合运用共词分析方法与自组织映射(SOM)方法,在词频统计的基础上,分析高频主题词在文献中的共现,并作为输入数据利用SOM Toolbox进行SOM聚类分析,得到领域热点研究主题。以传统医药领域为例进行实证分析,结果表明该方法对领域中热点主题探测有一定效果。  相似文献   

17.
《中国图书馆学报》科学知识图谱分析   总被引:1,自引:0,他引:1  
以CSSCI数据库中源于《中国图书馆学报》近10年的1625条文献为研究对象,应用CitespaceⅡ软件对引文数据和关键词数据等进行处理分析,用科学知识图谱的方式梳理了学报的研究力量分布、学术代表人物及重要学术文献,分析了研究的热点领域、前沿主题及所依赖的知识基础。  相似文献   

18.
传统学科主题研究主要基于学术文本题录数据,研究对象单一。本文以SIGIR(Special Interest Group on Information Retrieval)邮件列表为切入点分别构建SIGIR邮件列表数据集和同期会议论文数据集,并在两个数据集的基础上对信息检索的主题结构和主题演化进行对比分析。研究发现,信息检索领域存在研究内容不断深入、研究方法不断增多和核心主题逐渐分裂的规律;同时还发现,SIGIR邮件列表研究主题较会议论文而言,在时序上存在一定的"领先性",通过该研究旨在揭示SIGIR邮件列表在信息检索领域的学术价值。  相似文献   

19.
《新闻界》2021,(9):4-13
数字新闻学正在成为新闻学的主流范畴,研究文献也与日俱增,时至今日,有必要对数字新闻学的整体发展状况和知识脉络进行梳理、总结与反思。本研究以Webof Science核心数据集作为数据来源,借助Python工具训练LDA主题模型,使用困惑度评价指标确定主题数量,并使用主题强度分析研究热点和变化趋势。具体来说,本研究根据主题-词项概率分布,对获得的1325条文献摘要进行主题标识,抽取出了数字新闻学研究在1998-2021年的18个重要研究主题;根据文档-主题概率分布,引入时间维度计算主题强度分布。研究发现,包括数字技术的角色、新闻用户的主动行为、传统新闻理念的变迁、新闻学学科发展等研究主题都保持了相对稳定和上升的趋势,新闻职业身份、新闻学研究方法等少量主题呈下降趋势,但也仅仅是一种弱下降。具体而言,有7个主题的强度呈上升趋势,有5个主题的强度呈弱下降趋势,有6个主题的强度趋于平稳状态。数字新闻学在2021年及未来的研究中正呈现出主题越来越综合化的趋势。  相似文献   

20.
[目的/意义]探测高血压医学文献的主题和演化趋势,对发现高血压领域的研究热点和前沿,理解高血压领域概况和促进专家之间的知识交流具有重要意义。[方法/过程]以PubMed数据库下载的26 717篇与高血压相关的文献题录数据作为研究对象,抽取高频主题词构造共现矩阵,同时采用社会网络分析(SNA)和狄利克雷多项回归(DMR)主题模型从中观、微观层面探测高血压医学文献的主题分布和演化趋势;比较这两种方法的关联和异同点。[结果/结论]研究发现,高血压医学文献主要集中在危险因素、研究方法、基本要素、诊断治疗和动物实验这5个研究主题,主题的相对分布比率随着时间变化而不断改变。利用SNA方法获取的主题词更加具体和明确,而DMR方法获取的主题词更加宽泛,但在探索各个主题的演化趋势方面比较有优势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号