首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 413 毫秒
1.
指出随着互联网的发展和社交网络的广泛应用,学者之间的合作途径越来越多,学者具备多重的社团属性;但是,传统的基于聚类或模块度优化等社团划分方法往往将学者划分到唯一的社团。基于Salton方法构建合著网络,使用加权的链接聚类算法实现社团的聚类划分,该方法将节点间的边作为聚类对象,采用凝聚式层次聚类进行社团划分。因节点属于不同的边,因而可以归属于不同的社团,最终得到的社团可以部分重叠。为检验方法的有效性,使用基于CDPLP的合著网络构建系统获取数据,构建合著网络;然后使用加权的链接聚类进行社团发现和可视化。结果表明,该方法能有效地发现部分重叠的合著社团,且社团的意义比较明确。  相似文献   

2.
[目的/意义] 为提高引文网络的社团划分的准确性,提出一种基于加权的引文网络的社团划分方法。[方法/过程] 以Louvain社团划分方法为算法基础,将科学论文用向量空间模型表示,利用改进的余弦相似度方法计算相邻论文之间的相似度,并将其作为权重,综合考虑论文内容属性与结构属性,提出一种基于样本加权的引文网络社团划分方法。[结果/结论] 该算法将引文网络中论文的文本内容属性与拓扑结构属性结合起来,通过对Scientometrics期刊发表的论文以及主题为CRISPR的论文进行社团划分研究实验,结果表明该方法能改善引文网络社团的划分效果。  相似文献   

3.
针对Palla等人提出的派系过滤算法无法解决复杂网络中非派系内的节点的社团归属问题以及已有的硬划分社团检测算法不能反映复杂网络中社团间重叠的现象,提出一种改进的交连社团检测方法。该方法不仅可以有效地进行社团的检测,而且可以发现社团之间的重叠部分。对一个科研合作网络的实际数据进行仿真,实验结果表明该算法是可行的。  相似文献   

4.
孙海生 《图书情报工作》2016,60(10):123-129
[目的/意义] 传统共词分析的聚类算法存在以下不足:①关键词只能被划归一个聚类;②聚类过程对分类数目的确定缺乏严格判断标准。针对以上问题,采用复杂网络理论进行改进研究。[方法/过程] 采用连边社团检测算法对关键词进行聚类,以科学计量学为例进行实证研究。[结果/结论] 分析结果表明:算法对关键词的聚类结果有较好的改进效果,能够把核心度高的关键词同时划分到不同的研究主题之中,克服传统聚类算法的不足,而且划分密度可为聚类数目的确定提供客观判断依据。  相似文献   

5.
本研究在总结现有以共链分析和社会网络分析为主的学术网络局部结构识别方法的基础上,提出了改进的两步式K核分析方法,首次引入了复杂网络中的社区识别算法进行链接网络的分割,并尝试通过适用性评测验证快速聚类算法在同质Web链接网络的主题结构识别方面的有效性.最后的实验结果表明,本研究提出的改进K核分析方法可以有效地发现存在于链接网络中的主题聚类现象;同时研究中引入的快速聚类算法对以93所大学网站进行了聚类并获得六个主题类.通过聚类准确率指标计算,该聚类方法的平均准确率为72%.以上结论证实了本研究中采用的从链接关系度量,数据矩阵构建、到链接网络分析的方法体系是有效的.  相似文献   

6.
基于样本加权的文本聚类算法研究   总被引:3,自引:0,他引:3  
样本加权聚类算法是一种最近才引起人们注意的算法,还存在一些需要解决的问题,例如,聚类对象之间的结构信息对样本加权聚类是否有帮助,如何将结构信息自动转换为样本或对象的权重?针对该问题,本文以学术论文为聚类对象,以K-Means算法为聚类算法基础,利用论文之间的引用关系计算每篇论文的PageRank值,并将其作为权重,提出一种基于样本加权的新的文本聚类算法.实验结果表明,基于论文PageRank值加权的聚类算法能改善文本聚类效果.该算法可推广到网页的聚类中,利用网页的PageRank进行加权聚类,来改善网页的聚类效果.  相似文献   

7.
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性.  相似文献   

8.
基于HITS算法的期刊评价研究   总被引:1,自引:1,他引:0  
构建了适用于期刊引用网络的HITS(hypertext in-duced topic search)算法,利用2006年的中国科技论文与引文数据库(CSTPCD)分别计算所有及化学类统计源期刊的权威(authority)值与中心(hub)值,并与影响因子进行了对比研究,讨论了HITS算法用于期刊评价的优缺点以及适用范围。  相似文献   

9.
K-means算法是一种应用广泛的聚类算法,但是存在初始聚类中心和K值选取的难题.本文提出了一种基于学术文献同被引分析的初始聚类中心和K值选取的K-means改进算法.该算法属于两步聚类算法,首先对学术文献进行同被引分析,得到同被引矩阵,然后基于同被引矩阵进行层次聚类.算法记录每次迭代过程中被聚为一类的学术文献间的距离以及两次迭代间的距离差,当两次迭代的距离差取得最大值时取其聚类数作为第二步K-means算法的K值,并且将此时的类中心作为第二步K-means算法的初始聚类中心.第二步聚类则依据文献内容实现K-means算法.实验通过与经典K-means算法和基于凝聚层次聚类算法的改进K-means算法的对比,证明了本文提出的改进的K-means算法具备更优的聚类效果.  相似文献   

10.
[目的/意义] 针对目前全领域科学知识图谱构建方法中存在的技术难点,结合网络嵌入模型、机器学习聚类、流形学习可视化算法等人工智能领域的方法与模型,提出一套全新发现科学结构的知识图谱构建方案,以完善科学结构发现与可视化布局,并拓展科学知识图谱的分析应用场景。[方法/过程] 引入基于深度学习的网络嵌入模型和聚类方法改进原有的网络社团划分聚类方法,利用流形学习降维可视化算法扩大数据处理能力,并设计由下至上分层可视化布局方法,提升可视化图谱的稳定性与细节揭示能力。[结果/结论] 以科睿唯安公司的基本科学指标数据库(ESI)研究前沿中高被引论文作为分析数据集,使用新聚类算法得到1 169个研究领域,通过改进的可视化布局算法形成全领域科学结构图谱。与前几期科学结构图谱相比,本文提出的方法支持更大规模的数据分析,对可视化细节揭示与稳定性也有大幅优化,可以更好地展示全领域科学研究宏观结构及内在关系,为全领域科学知识图谱的绘制与构建提供更可靠的方法和技术支持。  相似文献   

11.
[目的/意义]复杂网络的社团结构研究已逐渐成为科学家借助文献数据开展科学结构研究的有力工具,社团划分效果的不同对科学结构的解读有着举足轻重的影响。本文对混合网络社团划分方法进行梳理,以期对该领域的相关研究提供借鉴参考。[方法/过程]通过文献调研,阐明混合网络的概念与类型,从网络构建或算法革新角度对各类型混合网络的社团划分研究进行概述,也对支撑混合网络社团划分的经典算法进行简介。[结果/结论]通过系统地梳理总结不同类型混合网络的社团划分工作,为后续的网络分析研究提供研究的视角和方法,同时揭示其在科学结构研究中所面临的挑战与所具有的现实意义,展望今后可能进一步拓展的相关研究方向。  相似文献   

12.
王新才  丁家友 《图书情报工作》2013,57(21):119-125,132
基于Web of Science(WoS)数据库,利用科学知识图谱工具CiteSpace、HistCite构造国外政府信息资源研究的主题、研究趋势与热点等网络,并借鉴网络科学理论及Gephi工具,对国外政府信息资源研究网络的小世界、无标度等特点进行复杂网络分析,期望有助于相关领域研究者从复杂网络的视角,探索和把握政府信息资源领域的研究脉络,并探讨一种从主题、作者、引文关系等多角度和层面进行数据分析,从而快速定位某研究领域核心知识网络的方法。  相似文献   

13.
生命科学近五年论文引文情况分析   总被引:1,自引:1,他引:0  
基于网络描述的复杂社会结构能够更好地展示网络中个体的联系特征,由此产生的复杂网络理论已经被广泛应用到社会科学的各个领域。近年来,除了对网络结构所具有的小世界、幂率分布等静态特性的分析外,大量研究开始关注网络结构中个体的组织特征。由这些个体组成的子图中,个体间有着更高的连接特征,而与其他子单元间的个体连接则相对稀疏。这种子单元通常被称为社团。社团发现及分析对研究网络的组织结构和社会特征有着重要意义。将社团发现方法应用到文献分析中,可以得到各学科领域的特征及关联关系。文章利用生命科学领域最近五年间的期-{iJ论文文摘记录,构造了两种引文网络。直接的引用网络和间接的论文耦合网络。对这两个网络基本属性的分析有助于了解生命科学领域发展的现状。此外,文章还使用了两种基于耦合网络的社团分析方法,重点分析了最近五年间生命科学领域的学科分类、关联特征以及随时间的演化情况,以助于理解整个生命科学领域的学科结构。  相似文献   

14.
针对文本信息内容结构参差不齐的问题,提出一种评价文本内容结构分析方法,该方法将文本中的句子作为节点,句子之间的共同名词作为边,构建文本复杂网络,并选取复杂网络的拓扑性质对文本结构特征进行分析。基于一个新闻文本案例构建复杂网络,并计算度、强度、最短路径、加权聚类系数等衡量指标,这些指标能很好地评价文本内容结构的好坏,也为理解和提取文本的中心思想、生成摘要、文本检索过滤提供重要参考依据。  相似文献   

15.
[目的/意义] 通过构建二模复杂网络模型,揭示隐藏在海量文献中的隐性知识。[方法/过程] 通过NetworkX复杂网络工具包,依据任意两个节点的共现关系构建二模复杂网络模型;对网络模型中节点的共现关系进行加权,计算网络的拓扑信息并进行AP聚类,提取节点间的直接关系;采用AUC方法对AA、JC、加权改进的wAA和wJC等4种链路预测算法进行评价,遴选出最合适的预测算法,并对复杂网络的隐性关系进行预测分析。[结果/结论] 以潜在药物靶点挖掘为例进行的实证研究结果表明,wAA链路预测算法为最优的链路预测算法;二模复杂网络模型、指标和方法体系在美国化学文摘社数据库中的药物靶点挖掘中具有一定的有效性。下一步计划在其他数据库中或其他研究领域中进行尝试,以进一步验证该模型的通用性和有效性。  相似文献   

16.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。  相似文献   

17.
利用信息可视化软件Citespace Ⅱ,以Web of Science(SCI,ISTP)中收录的1998-2011年间的521篇社群信息学相关文献及其所包含的17 968篇参考文献为研究对象,对发文时间、作者、机构、学科、参考文献等进行分析;同时通过对高频关键词和高中心度、高被引文献进行分析,明确社群信息学研究热点。结果显示,社群信息学研究还未迎来大发展时期,但知识储备速度在不断加快;社群信息学研究由社会网络和社会资本两个分支组成,其中,社会网络是主要分支;网络学习、社会网络、复杂网络、卫生保健将成为未来重点研究主题。  相似文献   

18.
当前,针对知识网络的链路预测主要是基于网络拓扑结构的相似性,很少考虑作者的研究领域,导致信息利用不充分等问题,因此本文提出了双层知识网络的链路预测框架hypernet2vec。双层知识网络,即作者合著关系网络和学术领域关系网络,利用网络表示学习,分别将两层网络中的节点映射到低维的向量空间,再输入到专门设计的卷积神经网络中计算并进行链路预测。与经典的链路预测指标如RA指标、LP指标和LRW指标等相比,hypernet2vec模型预测的AUC(area under curve)值取得了显著的提升,平均提升幅度达11.17%。文章还从情报产生层面和复杂系统层面,对模型发生作用的深层机理进行了探讨。  相似文献   

19.
[目的/意义]探索热点事件评论网络中话题社群及网民的情感波动,掌握舆情事件发展过程,对于整体把握热点事件的发展方向,做好新时期网络舆论的引导工作具有重大意义。[方法/过程]以复杂网络理论为基础,基于评论词语间的共现关系构建基于事件发展的子事件网络,通过社群发现算法来识别子事件评论网络中的话题社群,将情感词依据情感词典赋予情感分类属性,基于事件的演化过程动态地跟踪网民意见以及情感波动。[结果/结论]研究结果表明,评论网络群落发现以及变异系数方法可以有效地衡量网民话题讨论的规模与集中程度;评论网络中赋予情感词节点情感分类属性方法可以体现事件演化过程中网民的情感变化;舆论衍生话题对事件的舆情发展有持续性影响;网民话题讨论内容对于事件演化具有一定程度上的前瞻性。  相似文献   

20.
为减少一词多义现象及训练样本的类偏斜问题对分类性能的影响,提出一种基于语义网络社团划分的中文文本分类算法。通过维基百科知识库对文本特征词进行消歧,构建出训练语义复杂网络以表示文本间的语义关系,再次结合节点特性采用K-means算法对训练集进行社团划分以改善类偏斜问题,进而查找待分类文本的最相近社团并以此为基础进行文本分类。实验结果表明,本文所提出的中文文本分类算法是可行的,且具有较好的分类效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号