首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义] 准确地计算微博相似度可以提高微博主题挖掘效率,对舆情治理、保障信息安全具有实践意义。针对微博文本语义稀疏、高维的问题,提出一种融入微博非文本特征的超边相似度算法。[方法/过程] 分析微博舆情发生机制,利用超网络模型表示微博舆情主题形成过程,通过计算各层子网相似度及各层子网对主题形成的贡献度构建超边相似度算法。[结果/结论] 研究发现,论文所提出的相似度方法有助于提升微博舆情信息的主题聚类效果,特别是对于文字性表述相似程度高的微博信息,具有明显的主题区分性。  相似文献   

2.
作者合著网络中研究兴趣相似性实证研究   总被引:2,自引:0,他引:2  
[目的/意义]从作者微观个体研究兴趣角度出发,通过对作者合著网络中作者关联关键词集的研究,定量地验证研究兴趣相似是作者合作的一个动机。[方法/过程]收集WOS中检索领域相关文献题录信息,构建作者合著网络,并利用Louvain算法划分社区,实现了Jaccard系数及余弦相似性系数的计算指标,统计与对比分析整体网络及社区内部作者研究兴趣的相似性。[结果/结论]在网络整体层次,作者合著网络中作者的研究兴趣相似性较高,但也存在一定比例的差异性即互补性;在科研社区内部,合著作者平均研究兴趣相似性及互补性均高于网络整体层次,科研社区的形成受到作者研究兴趣的影响。两个层次的兴趣相似性反映了研究兴趣相似是作者合作的一个重要动机。  相似文献   

3.
认为处于多维社会网络中的用户会表现出多种行为取向和兴趣爱好,单独使用多维网络中的一维很难进行有效的社区发现。为了有效解决以上问题,首先基于用户关系紧密度将社交媒体中有向网转化为无向带权网,并将所有一维社交网络进行集成;然后利用SSN-LDA对社交用户进行隐含社区建模,以根据用户-隐含社区概率分布计算用户相似度;最后使用二分K均值进行用户社区划分。在真实科学网博客上进行试验,结果表明该方法能较好地进行用户社区划分。  相似文献   

4.
利用查询术语同义词关系扩展信念网络检索模型   总被引:2,自引:0,他引:2  
信念网络模型是一种重要的、基于贝叶斯网络的信息检索模型.它定义了一个明确的样本空间,给出了信息检索的一个灵活有效的基本框架.本文针对传统信念网络模型没有利用术语之间关系的缺陷,利用信息检索用同义词和词语相似度等概念,提出了最优同义词、相似概念、概念相似度等定义,提出了一种概念相似度的计算方法.然后利用上述定义对传统信念网络模型进行扩展,提出了一种基于查询术语同义词关系的扩展信念网络检索模型,讨论了扩展模型的拓扑结构和利用扩展模型进行信息检索的具体方法.实验结果表明,扩展后的信念网络模型比传统模型具有更好的检索性能.  相似文献   

5.
复杂网络聚类算法的研究对分析网络拓扑结构、理解其功能、发现网络中的隐藏规律以及预测网络行为具有十分重要的理论意义。目前许多寻找重叠点的算法不多,并且很多都需要比较高的时间复杂度。文章通过观察网络社团之间的相邻点与每二社团的连接边数以及定义阈值的方法对其进行了改进,最后通过期刊之间的引用关系计算期刊引用网络的相似性,构造网络图。采用基于谱的聚类算法和改进后的方法对该图进行浆类,从而验证改进算法的先进性。  相似文献   

6.
[目的/意义]构建情报学领域核心作者研究兴趣相似性网络,研究该网络的社群结构与社群隶属问题。[方法/过程]在CSSCI数据库以中图分类号为检索条件,下载该学科1998-2015年所有的论文数据,通过普莱斯定律识别核心作者。将作者研究兴趣用词袋模型表示,并计算作者间研究兴趣的余弦相似性,进而构建核心作者研究兴趣相似性网络。在此基础上进行社群划分并识别各社群研究主题,计算作者对各社群的隶属度与模糊熵。[结果/结论]研究发现,当前我国情报学研究可分为信息组织与检索、文献计量与科学评价、竞争情报与知识管理、情报学学科整体研究4个领域,大部分作者研究并不局限于单个领域,竞争情报和文献计量领域界限明显,较少有作者将彼此作为次要隶属社群。  相似文献   

7.
基于关键词共现的概念知识网络具有明显的层次结构,以节点k-core值为依据可将其划分出层次。引入三元闭包作为知识网络分析的基本单元,在层次视角下,三元闭包存在多样性,可用于描述节点的同层聚集、知识融合、知识分化等多种现象。以“数字图书馆”领域为例,由其关键词组成的概念知识网络可进行分层,引入节点层级差异和三元闭包类型后,可以更深入地分析知识网络中节点的微观关联结构。  相似文献   

8.
人际情报网络中的关键联系识别   总被引:4,自引:1,他引:3  
在介绍人际情报网络结构的确定和表示方法基础上,用“去一交替法”,利用网络点度中心势、接近中心势、中介中心势、平均距离以及关键节点对距离等定量指标来识别人际情报网络的关键联系。通过案例研究了该方法在人际情报网络关键联系识别中的运用,发现采用不同指标的识别效果各具特点。这些指标可分别用于识别连接核心节点的关键联系、影响情报交流能力的关键联系、影响情报交流效率的关键联系、对边缘节点情报交流有重要影响的关键联系和影响重要节点间情报交流的关键联系等场合。  相似文献   

9.
In this study we map out the large-scale structure of citation networks of science journals and follow their evolution in time by using stochastic block models (SBMs). The SBM fitting procedures are principled methods that can be used to find hierarchical grouping of journals that show similar incoming and outgoing citations patterns. These methods work directly on the citation network without the need to construct auxiliary networks based on similarity of nodes. We fit the SBMs to the networks of journals we have constructed from the data set of around 630 million citations and find a variety of different types of groups, such as communities, bridges, sources, and sinks. In addition we use a recent generalization of SBMs to determine how much a manually curated classification of journals into subfields of science is related to the group structure of the journal network and how this relationship changes in time. The SBM method tries to find a network of blocks that is the best high-level representation of the network of journals, and we illustrate how these block networks (at various levels of resolution) can be used as maps of science.  相似文献   

10.
指出随着互联网的发展和社交网络的广泛应用,学者之间的合作途径越来越多,学者具备多重的社团属性;但是,传统的基于聚类或模块度优化等社团划分方法往往将学者划分到唯一的社团。基于Salton方法构建合著网络,使用加权的链接聚类算法实现社团的聚类划分,该方法将节点间的边作为聚类对象,采用凝聚式层次聚类进行社团划分。因节点属于不同的边,因而可以归属于不同的社团,最终得到的社团可以部分重叠。为检验方法的有效性,使用基于CDPLP的合著网络构建系统获取数据,构建合著网络;然后使用加权的链接聚类进行社团发现和可视化。结果表明,该方法能有效地发现部分重叠的合著社团,且社团的意义比较明确。  相似文献   

11.
Bibliographic coupling (BC) and co-citation (CC) are the two most common citation-based coupling measures of similarity between scientific items. One can interpret these measures as second-neighbor relations distinguished by the direction of the citation: BC is a similarity between two citing items, whereas CC is that between two cited items. A previous study proposed a two-layer node split network that can emulate clusters of coupling measures in a computationally efficient manner; however, the lack of intralayer links makes it impossible to obtain exact similarities. Here, we propose novel methods to estimate intralayer similarity on a node split network using personalized PageRank (PPR) and neural embedding (EMB). We demonstrate that PPR is strongly correlated with the coupling measures. Moreover, our proposed method can yield precise similarities between items even if they are distant from each other. We also show that many links with high similarity are missing in the original BC/CC network, which suggests that it is essential to consider long-range similarities. Comparative experiments on global and local edge sampling suggest that local sampling is stable for PPR in node split networks. This analysis offers valuable insights into the process of searching for significantly related items regarding each coupling measure.  相似文献   

12.
文章简要介绍了复杂网络的概念和科研合作网络相关知识,对生命科学领域国内561万多篇期刊论文进行了统计与合作网络分析,并从合作网络中抽取出科研机构子网络和医院子网络,针对复杂网络的几个特征进行对比性分析,找出了各个网络的不同特性,分析说明不同机构的科研合作模式。  相似文献   

13.
专利权人关联网络的社会网络分析方法研究   总被引:1,自引:0,他引:1  
在方法体系层面上设计出适用于专利权人关联网络分析的社会网络分析方法体系框架,框架包括基于合作、基于引用和基于技术主题三个方面。其中,基于合作的专利权人合作网络分析方法包括全球规模、特定学科主题、特定专利权人和自我中心网络(ego网络)四种类型;基于引用的专利权人引用网络包括直接引用、专利共引和专利文献耦合网络三种类型;基于主题的专利权人主题关联网络包括专利分类号共现、分类号相似度计算和主题词共现三种类型。文章对整个方法体系的分析方法进行了系统的研究,包括基本原理、数据集的构建策略、分析方法的功能、不足、指标选取等方面。最后利用中国科学院2005~2008年的发明专利对基于合作和基于技术主题的专利权人关联网络进行了实证研究。  相似文献   

14.
基于社会化标签网络的细粒度用户兴趣建模   总被引:1,自引:0,他引:1  
针对目前由社会化标签抽取用户兴趣模型过程中存在的问题,在借鉴社会网络分析的基础上,提出构建网站层次和用户层次的社会化标签网络对用户产生的社会化标签进行序化,进而分别得到反映主题领域的社会化标签使用文档和用户标签网络,通过两者相似度的计算形成细粒度用户兴趣模型。实验结果能够验证该模型的科学性。  相似文献   

15.
This paper explores intellectual and social proximity among scholarly journals by using network fusion techniques. Similarities among journals are initially represented by means of a three-layer network based on co-citations, common authors and common editors. The information contained in the three layers is then combined by building a fused similarity network. The fusion consists in an unsupervised process that exploits the structural properties of the layers. Subsequently, partial distance correlations are adopted for measuring the contribution of each layer to the structure of the fused network. Finally, the community morphology of the fused network is explored by using modularity. In the three fields considered (i.e. economics, information and library sciences and statistics) the major contribution to the structure of the fused network arises from editors. This result suggests that the role of editors as gatekeepers of journals is the most relevant in defining the boundaries of scholarly communities. In information and library sciences and statistics, the clusters of journals reflect sub-field specializations. In economics, clusters of journals appear to be better interpreted in terms of alternative methodological approaches.  相似文献   

16.
余传明  李浩男  安璐 《情报学报》2020,39(5):521-533
随着大数据的迅速发展,知识网络在不同语言、不同领域和不同模态等情境下呈现高度多样性和复杂性,如何对齐与整合多源情境下的异构知识网络,成为研究者所面临的严峻挑战。本文在知识网络深度表示学习的基础上,提出一种由知识网络构建、跨语言网络表示学习和统计机器学习三个模块构成的知识网络对齐(knowledge network alignment,KNA)模型。为验证模型的有效性,在中英文双语知识网络数据集上开展实证研究,借助于网络表示学习算法将异构知识网络表征到同一空间,利用已知的对齐链接来训练统计机器学习模型,并通过模型来预测未知的节点对齐链接。KNA模型在跨语言共词网络对齐任务中取得Precision@1值为0.7731,高于基线方法 (0.6806),验证了KNA模型在跨语言知识网络对齐上的有效性。研究结果对于改进知识网络的节点对齐效果,促进多源情境下的异构知识网络融合具有重要意义。  相似文献   

17.
Various factors are believed to govern the selection of references in citation networks, but a precise, quantitative determination of their importance has remained elusive. In this paper, we show that three factors can account for the referencing pattern of citation networks for two topics, namely “graphenes” and “complex networks”, thus allowing one to reproduce the topological features of the networks built with papers being the nodes and the edges established by citations. The most relevant factor was content similarity, while the other two – in-degree (i.e. citation counts) and age of publication – had varying importance depending on the topic studied. This dependence indicates that additional factors could play a role. Indeed, by intuition one should expect the reputation (or visibility) of authors and/or institutions to affect the referencing pattern, and this is only indirectly considered via the in-degree that should correlate with such reputation. Because information on reputation is not readily available, we simulated its effect on artificial citation networks considering two communities with distinct fitness (visibility) parameters. One community was assumed to have twice the fitness value of the other, which amounts to a double probability for a paper being cited. While the h-index for authors in the community with larger fitness evolved with time with slightly higher values than for the control network (no fitness considered), a drastic effect was noted for the community with smaller fitness.  相似文献   

18.
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务。在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决。[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别。[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高。  相似文献   

19.
当前,针对知识网络的链路预测主要是基于网络拓扑结构的相似性,很少考虑作者的研究领域,导致信息利用不充分等问题,因此本文提出了双层知识网络的链路预测框架hypernet2vec。双层知识网络,即作者合著关系网络和学术领域关系网络,利用网络表示学习,分别将两层网络中的节点映射到低维的向量空间,再输入到专门设计的卷积神经网络中计算并进行链路预测。与经典的链路预测指标如RA指标、LP指标和LRW指标等相比,hypernet2vec模型预测的AUC(area under curve)值取得了显著的提升,平均提升幅度达11.17%。文章还从情报产生层面和复杂系统层面,对模型发生作用的深层机理进行了探讨。  相似文献   

20.
以CNKI引文数据库医药卫生专题下的数据为研究对象,利用社会网络分析方法,分析了我国医学领域内的知识交流特点。结果表明:临床医学的知识流入量和知识流出量都位居第一,是知识交流网络中的核心;基础医学是其他医学学科的理论基础,属于医学网络中的重要知识源;中医学与外科学及其他临床类学科的交流密切;在跨学科医学研究中肿瘤学表现得比较活跃;口腔医学和精神病学在知识交流网络中与其他学科的交流较少,是独立性较强的两个学科。利用这些特点开展学科信息推送服务,可提高信息服务的针对性,加速不同医学学科间的知识交流,推动医学领域内的跨学科合作研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号