首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
李海林  黄思雨 《情报科学》2019,37(10):53-59
【目的/意义】鉴于参考文献在期刊论文发表过程中的重要性以及引证文献对期刊论文的影响力,提出基于 时间序列数据聚类的期刊参考文献与引证文献来源分析研究。【方法/过程】以图书情报类某重要核心期刊 2010-2017年期间刊发的3500篇论文作为样本数据,利用正则表达式对非结构化的样本数据进行结构化处理,将参 考文献来源期刊和引证文献来源期刊的均篇引用均值转化为时间序列数据,结合时间序列数据聚类方法分别从数 值和趋势两个方面展开研究,探究发现期刊参考文献与引证文献两种来源期刊各自之间隐含的相关关系。【结果/ 结论】研究发现:新方法可以从时间变化的角度对来源期刊实现聚类划分,自适应地找到中心来源期刊作为簇的特 征对象,其获得的结论可为目标期刊编辑部,论文读者与创作者对期刊文献的质量管理提供决策参考和理论依据。  相似文献   

2.
[目的/意义]作者相似度研究是探测学科知识结构、挖掘潜在合作关系的重要基础。[方法/过程]本文拟构建作者的关键词—文献2模矩阵,通过研究矩阵对应的灰度图像之间的相似性来判定作者相似性,并利用灰色关联理论计算基于合著关系和基于关键词的作者相似度,最后进行实证分析,对比三种作者相似性结果。[结果/结论]实验表明:基于关键词—文献矩阵的作者相似度研究可以减少因作者发文量不同及高频关键词的使用带来的影响,同时可以放大作者间研究内容的差异性与相似性,能较为准确地反映作者的相似度。  相似文献   

3.
雷晓  常春  刘伟 《情报科学》2021,39(1):135-141
【目的/意义】为保证叙词表术语收录的完整性,需要及时将领域出现但未收录的新术语补充收录到叙词表 中,结合候选词的时间及文档词频特征,从时间序列角度探索新术语的分布情况以指导新术语遴选是值得研究的 问题。【方法/过程】文章主要对词汇文档词频对应的时间序列进行研究,将时间序列进行词频归一化及时间等长预 处理,引入k-means聚类算法,对候选词汇进行基于时间序列趋势变化的聚类,探索术语以及非术语趋势变化的规 律,进而总结新术语应该满足的趋势变化特征。【结果/结论】通过聚类研究,总结得出新术语普遍处于增长趋势。 实证将处于增长状态的候选词汇遴选出来,经过专家判断,该方法可以有效从候选词汇中遴选出其中能补充到叙 词表中的新术语,该方法有比较高的准确率。【创新/局限】创新之处表现为叙词表新术语的遴选中同时考虑了时间 变化和文档词频因素,局限于数据处理规模,实证中只统计了论文关键词的词频数据。  相似文献   

4.
新出现趋势识别和分析方法引介   总被引:2,自引:0,他引:2       下载免费PDF全文
 新出现趋势是一个新研究论题深入研究并日趋重要的趋势。这种趋势在科学前沿形成,通过研究人员相互引用表现出来。检测这样的趋势所用的方法起源于引文分析。以前,引文分析仅仅是简单的静态的数量分析,而现在开始利用复杂网络分析和时间序列分析进行动态发展趋势预测。目前新出现趋势分析的方法主要有两种:一是从高引用文章组成的聚类串随时间推移的变化特征中检测出新出现趋势。二是在引文网络中所形成的研究社区中检测新出现趋势。目前新出现趋势分析还要在三个方面进行深入研究:一是要在实证研究充分开展的基础上,调查各个研究领域中新出现趋势的形成机制。二是要研究不同的时间序列对新出现趋势的识别和分析的影响。三是要研究新出现趋势对引文网络局部特征的影响。  相似文献   

5.
[目的/意义]关键词是反映期刊研究主题、研究方法和数据源等信息的重要途径。本文尝试通过论文关键词来研究学术期刊的相似度,为期刊分类等学术研究和实际工作提供参考。[方法/过程]首先,在相关文献梳理的基础上,提出了基于论文关键词的两种期刊相似度计算方法。然后,以《中国图书馆学报》和《情报学报》为实证对象,从CSSCI采集了两种期刊1998-2017年的关键词数据。最后,计算了两种期刊的相似度,并分析了两种期刊论文的共现关键词。[结论]研究发现,两种期刊的相似度有一定波动,但整体上呈现为一个下降趋势。这反映出两种期刊上发表的论文的相似性在不断下降,而差异性在不断增加。  相似文献   

6.
研究热点的探测为科学研究和政府决策提供了重要的支持,通过对政府在热点研究领域的资金投入,以期研究政府研发投入对热点研究领域存在的导向和影响作用。通过关键词聚类的方法对滑动时间窗内的文献进行社团划分,进而通过可视化图谱对总体聚类与政府扶持聚类效果进行比较分析,研究政府投入对该领域发展的影响及其规律。通过统计分析和聚类间的可视化比较分析,存在政府投入的科学学热点领域在整体研究热点聚类中占据了重要的位置,政府投入对科学学研究的发展具有重要的导向作用。  相似文献   

7.
程婷  王冰 《现代情报》2014,34(7):135-140
本文运用科学计量学方法对7 055条政务公开CNKI期刊论文数据进行计量统计,分析政务公开研究高频关键词的共现矩阵,得到共现聚类树和共现网络。在关键词共现分析基础上对政务公开的研究热点和未来研究趋势进行了分析。  相似文献   

8.
针对现有的一些时间序列相似性度量函数存在的问题,在时间序列分段线性表示的基础上,提出了一种新的基于面积的度量方法。分段后的时间序列,用对齐法解决时间序列模式之间长度可能不相等的问题,再通过平移,将相交的两线段所围成的面积,作为相似性度量的函数。该方法与现有的一些相似性度量方法进行比较,并且通过人工模拟数据和真实的股票数据进行实验,证明了该方法能够更好地进行相似性搜索,并且较其他的方法,更合理,有效。  相似文献   

9.
张蕴娣  于宁  赵闯 《情报科学》2022,40(10):187-192
【目的/意义】以主题聚类的方法揭示国内图情领域区块链研究热点,为区块链在图情领域的研究工作提供 参考。【方法/过程】利用中国知网数据库检索区块链在图情领域应用的全部期刊论文、会议论文与学位论文,提取 了470个关键词,并利用杰卡德系数计算文献的相似程度,形成10个主题聚类,之后利用IG(信息增益法)计算所有 关键词在主题聚类中的重要程度,通过前10位核心关键词阐述各主题聚类中研究论文的主要研究内容,并通过主 题聚类下的年度发文趋势分析区块链在图情领域未来的发展趋势。【结果/结论】文章共提取出区块链技术、智慧图 书馆、资源建设、信息服务、阅读推广、隐私保护、借阅服务、科学数据、版权保护、情报分析十大主题聚类,并将其归 纳出包含基础层、技术层、应用层、拓展层的研究框架,分析了未来研究趋势将更加集中于情报分析、智慧图书馆、 阅读推广、科学数据、版权保护、隐私保护六大主题中。【创新/局限】对研究主题的分析还可以采用更多的视角进行 分析,如知识图谱等。  相似文献   

10.
文章提出了科技论文关键词的战略图分析方法,从论文作者关键词、机器标引关键词和标题摘要中抽取的关键词中选择关键词,以消除标引效应,通过聚类将关键词划分为研究主题簇,计算研究主题簇的向心度指标和密度指标,绘制战略图,将研究主题簇分为4类,据此分析问题领域现状;将数据分为若干阶段,分别形成战略图,通过计算相邻阶段的主题簇的相似度指标、起源指标和影响指标,了解研究主题变迁和相互关系。实验证明了战略图分析方法的有效性。  相似文献   

11.
【目的/意义】针对基于关键词的科技文献聚类研究进行了一些探讨,包括:使用具有不同特征的关键词来 实现文献聚类在效果上有何差异;如何按特征对关键词进行选择来提高文献聚类效果。【方法/过程】按照关键词词 频与语义类型特征设置对照组进行实证研究,观察其对文献聚类密度及文献语义表示效果的影响。【结果/结论】单 独使用具有超高频、次高频、研究主题或限定范围特征的关键词进行文献聚类能使聚类密度较为合适;超高频特征 通常在其他频次中都具有体现,次高频词能同时反映不同频次的关键词特征,但次高频词对中频词特征的表示不 够全面;将语义类型不同的关键词分开来实现文献聚类,其效果好于将关键词进行组配,语义类型不同的关键词间 存在互斥性。【创新/局限】本文发现了在以关键词间的共现关系为基础来进行文献聚类时单独选择次高频或某一 语义类别的关键词来实现文献聚类具有较好效果,但缺少对关键词间语义结构关系的进一步研究。  相似文献   

12.
【目的/意义】从海量自助餐用户评论数据中抽取有效关键词构建主题和主题词,协助商家了解用户口碑, 进而更好的改善餐饮行业的管理水平。【方法/过程】通过融合TF-IDF、TextRank和LMKE三种不同的关键词抽取 方法获取最优关键词,再对抽取的关键词进行语义聚类、主题识别、主题词挖掘和主题权重计算,最后在采集的美 团数据集上进行验证方法的有效性。【结果/结论】实验结果表明,三种关键词抽取方法的融合比单个关键词算法效 要好,文本评论聚类后的主题分别是:味道、菜品、环境、服务、价格,主题的重要程度依次是:味道 36.2%、服务 22.9%、价格15.1%、环境13.6%、菜品12.2%。实验结果证实,通过该方法能够有效识别和构建主题及主题词,并计算 出用户对于不同主题关注的重点内容,同时为餐饮行业主题及主题词挖掘和应用研究提供了一定的理论和技术基 础。【创新/局限】提出一种半监督语义聚类的主题识别、主题词构建和主题权重评估方法;不足之处在于本次实验 仅以武汉地区的美食自助餐评论为主,其构建的主题适用性范围有限。  相似文献   

13.
碳中和是关系到解决全球环境问题、促进国家经济发展、推动社会可持续发展的重要议题。本文以1991—2021年间Web of Science和中国知网数据库收录的7192篇国际学者发表的英文文献、3778篇中国学者发表的中英文文献为研究对象,运用信息可视化软件CiteSpace,从时间分布、空间分布、研究热点冲积图、关键词共现图谱、关键词聚类图谱等方面,揭示了国内外碳中和研究现状与发展趋势。结果表明:①从时间脉络上看,国内外碳中和演进分为3个阶段:萌芽期(1991—2006年)、发展期(2007—2014年)和繁盛期(2015—2021年);进入21世纪后,国内外碳中和发文量均呈现快速增长趋势,2021年中国碳中和研究爆发式增长,年发文量超1500篇。②从空间分布上看,碳中和研究地区和研究机构呈现多极化发展趋势,美国、中国和英国等国家发文量较高,主要以高校和研究所为主。③从研究热点上看,围绕基础研究与动态监测评价、技术研发与应用、政策设计与路线图3个重大科学问题,碳中和研究主要从碳足迹、能源、碳捕获与封存技术、生命周期评价、碳交易市场和全球治理等热点展开。④从关键词聚类上看,碳中和相关研究可以从个体、行业、国家3个层面聚类成4个主题:个体碳中和态度与行为、碳中和技术、碳市场与碳金融体系、政策引导与全球治理。本文对每个主题的内涵和研究进展进行梳理,总结出碳中和的研究热点与演进趋势,为中国实现碳中和目标提供理论参考。  相似文献   

14.
一种基于关键词加权的共词分析方法   总被引:1,自引:0,他引:1  
基于关键词的共词分析是文献计量中常见的一种研究方法,该方法是利用论文关键词在文献数据库中成对出现的统计学特征来分析关键词之间的亲疏关系,从而揭示这些关键词所代表的主题之间的关联结构。本文分析了传统的关键词共词分析法中存在的忽视关键词之间的重要性问题,探讨了其中基于关键词加权的合理性和必要性。本文还提出了一种基于关键词加权的共词分析方法,通过在关键词词频统计和词对相似度计算两个步骤中使用的改进的加权算法,从而实现了基于关键词重要性的加权。  相似文献   

15.
Assessing the similarity of scientific outputs based on an indicator has not been addressed much so far. The topic, however, may find several potential applications which can help enrich procedures of ranking, research monitoring, and scientific policy-making. The present study offers a new method to quantify such similarities based on keyword co-occurrence matrices. In the proposed method, first, the keyword co-occurrence networks are transformed into their associated newly defined fuzzy sets, named as scientosemantic domains. Then, a fuzzy distance between the two domains is found based on an arbitrary indicator. In this paper, the three indicators of frequency, development and investment appeal are used. The proposed method is implemented for five types of concept comparison. For each type, concepts are represented by a canonical keyword with different field codes. Scientosemantic domains of concepts are sourced out of bibliometric data obtained from appropriate queries on SCOPUS. Number of keywords used to define scientosemantic domains ranges from about 30 to 800. Since indicator-based comparison of scientosemantic domains are not dealt with in the literature, the obtained distances between concepts are verified by qualitative and expert evaluations. For all cases, frequency- and development-based distances are less than those for investment appeal; while crisp distances for the latter extend beyond 0.6, the former does not exceed 0.3. The greatest distances are observed for investment appeal in technology-related keywords.  相似文献   

16.
高劲松  黄梅  付家炜 《现代情报》2021,40(12):130-139
[目的/意义] 能以简洁的可视化来追踪某学科研究热点随时间的变化趋势,对于掌握学科研究热点的动向具有重要意义。词频分析法是学科研究热点分析方法之一,目前存在众多的基于词频分析的可视化工具,但是这些可视化工具能够以简洁的可视化形式清晰地展现年度热点存在局限性。[方法/过程] 因此本文提出通过学科领域年度发文量与学科全部发文量的比值来衡量年度热点关键词对总年度热点关键词贡献率的可视化方法:基于年度贡献率与二八定律设定并调整阈值参数来控制年度高频关键词的呈现数量,将选取的年度高频关键词按照词频大小与年份依次排序以实现研究热点可视化。[结果/结论]以"关联数据"领域为例进行实证研究,通过分析本文方法提取的高频关键词与现有高频词阈值算法的匹配情况,对比本文方法与Citespace共现图谱的可视化呈现效果,对本文方法的可行性进行检验与评价。  相似文献   

17.
蔡霖  任锦鸾 《科研管理》2021,42(12):100-107
    如何与产业融合是人工智能技术发展的关键。鉴于“万物皆媒”的未来场景,对智能媒体技术的发展趋势、技术集群演变和国际竞争态势研究对媒体行业及其相关行业的发展,国家核心竞争力的提高都至关重要。本文对2008年至2020年间的专利数据进行检索,鉴别出75 051条德温特专利数据作为分析基础。采取关键词、专利代码及学科领域相结合的方法确定了智能媒体技术涉及的专利范围;结合时间变迁和聚类分析将智能媒体技术的发展分为平稳、迅速、平缓和迅猛发展四个阶段;利用共词分析建立了不同专利代码之间的共现关系,利用社会化网络分析将共现关系可视化,识别出不同阶段的主要技术集群;结合企业专利拥有量及所属国家分析了智能媒体技术的国际竞争态势。基于以上定量分析从媒体业务与智能技术融合视角提出了媒体机构的智能化战略建议,从智能媒体技术研发、行业应用、国际竞争力提升视角提出了智能媒体产业发展政策建议。本文基于专利测度从发展趋势、技术集群演变和国际竞争态势三方面分析了智能媒体技术发展规律,为从专利视角对人工智能技术与产业融合的研究提供了方法体系。  相似文献   

18.
对学科领域研究主题优先级进行战略分析,能够帮助科研人员及科研管理决策部门快速了解学科领域的研究态势、发现科学前沿,对提高科研产出起到积极的支持和促进作用。本文以图书情报学研究主题为例,采用主题提取与趋势分析相结合的方法,在提取学科主题基础上,从发文趋势和引文趋势两个维度,绘制含“研究贫乏区、热点区、冷点区、过热区”的我国图书情报学领域研究主题战略坐标。研究表明:本文提出的趋势战略坐标能够有效展示学科领域不同研究主题的发展阶段,全面、细致地呈现不同研究主题的发展等级。  相似文献   

19.
田大芳 《现代情报》2010,30(9):31-35
信息可视化可以让我们直观地观察某个主题在一定时间段的研究现状。本文在对2000-2009年情报服务研究论文640个关键词统计分析的基础上,选取33个高频词作为研究主题的可视化对象。利用可视化工具Ucinet和PASW绘制了关键词网络的多维尺度分布图,并从定量的角度判断了情报服务10年来的研究热点和未来的研究趋势。最后本文提出了情报服务研究的4点思考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号