首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 656 毫秒
1.
鉴于无线传感器的网络节点能量受限特性,提出一种新的无线传感器网络分簇算法,也就是响应式分布分簇算法。这种算法的优点就在于只通过拓扑信息就可以立即进行簇头选举,而不像传统的分簇算法要提前预知节点与节点位置之后才可以进行进行簇头选举,另外,还可以根据代价函数对簇头进行划分,被无线传感器网络广泛应用。  相似文献   

2.
基于C-value与TF-IDF的文献簇主题识别研究   总被引:1,自引:0,他引:1  
引文分析是科技情报分析的一种重要方法和技术,特别是建立在共耦合和共被引基础上的引文聚类分析逐渐发展成为科技情报分析中最活跃的研究领域之一.引文聚类分析形成一系列由科技文献组成的文献簇,并不能直接体现出文献簇的主题,因此需要识别这些文献簇的内容特征.本文分析了引文分析中文献簇主题识别的典型方法及局限,提出了结合C-value和TF-IDF算法的文献簇主题识别方法.实验表明,该方法可以充分地利用C-value和TF-IDF算法的优点,对C-value和TF-IDF算法中不合理的地方予以了改进,从而可以更好地应用于引文分析中文献簇的主题识别.  相似文献   

3.
复杂网络聚类算法的研究对分析网络拓扑结构、理解其功能、发现网络中的隐藏规律以及预测网络行为具有十分重要的理论意义。目前许多寻找重叠点的算法不多,并且很多都需要比较高的时间复杂度。文章通过观察网络社团之间的相邻点与每二社团的连接边数以及定义阈值的方法对其进行了改进,最后通过期刊之间的引用关系计算期刊引用网络的相似性,构造网络图。采用基于谱的聚类算法和改进后的方法对该图进行浆类,从而验证改进算法的先进性。  相似文献   

4.
基于Apriori改进算法的局部反馈查询扩展   总被引:1,自引:0,他引:1  
提出面向查询扩展的Apriori改进算法,采用三种剪枝策略,极大提高挖掘效率;针对现有查询扩展存在的缺陷,提出基于Apriori改进算法的局部反馈查询扩展算法,该算法用Apriori改进算法对前列初检文档进行词间关联规则挖掘,提取含有原查询词的词间关联规则,构造规则库,从库中提取扩展词,实现查询扩展。实验结果表明该算法能够提高信息检索性能,与现有算法比较,在相同查全率水平级下其平均查准率有了明显提高。  相似文献   

5.
冯珺  孙济庆 《情报学报》2007,26(3):356-360
本文通过引入知网的概念,对传统的K-means聚类算法进行了分析,初始聚类中心的选择对聚类结果有较大的影响,初始值选择的不好,可能无法得到有效的聚类结果,这也成为K-means算法的一个主要问题。采用聚类中心的搜索算法来进行聚类中心的选取,对其初始聚类中心确定一个初始划分,运用“射靶”的原理进行了改进,找到“靶心”得到一个最终选定的初始聚类中心,从而提高算法的稳定性,得到较稳定的聚类结果。实验结果表明,采用改进后的K-means作为簇心生成算法,随着待聚类文档数目的增加,效率提升更为突出。  相似文献   

6.
基于聚类的网络舆情热点发现及分析*   总被引:9,自引:0,他引:9  
根据对网络舆情分析的需求,构建出基于聚类的网络舆情热点发现及分析系统。通过对样本网页文本的特征提取,构建向量空间模型,使用OPTICS算法获取网页热点簇,根据热点簇特征向量对网页进行二次聚类,从而获取关于舆情的时间演变模式,为相关领域研究提供决策支持。通过二次聚类,提高舆情网页相关度的质量,使网络舆情分析更为准确可靠。  相似文献   

7.
传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题.本文结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型.实证分析表明,新算法有助于提升系统的检索效率.本文首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法.最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响.  相似文献   

8.
基于两字词簇的汉语快速自动分词算法   总被引:10,自引:1,他引:9  
本文提出了一种快速汉语自动分词算法。其主要思想是利用汉语中两字词占75%的统计规律,提出了两字词根和两字词簇的概念。算法把三音节以上的词用两字词簇来压缩处理,也就是把长词的扫描范围限定在词汇量很小的词簇内,从而不仅提高了分词速度,而且彻底解决了传统最大匹配分词算法中最大匹配词长的设定问题。另外,本文还提出了用两字词簇快速检测交叉歧义的算法。本文的分词算法简洁、速度快、易于实现  相似文献   

9.
介绍SNS开放平台及其应用的相关概念,分析开放平台应用现状和运营模式,基于国内此类软件的统计数据,采用DTW算法度量变长时序数据的形状相似性,使用一维序列变换改进K中心点聚类的簇中心计算方法,并对数据进行时间序列聚类挖掘,最后使用产品生命周期理论分析聚类结果。  相似文献   

10.
针对Palla等人提出的派系过滤算法无法解决复杂网络中非派系内的节点的社团归属问题以及已有的硬划分社团检测算法不能反映复杂网络中社团间重叠的现象,提出一种改进的交连社团检测方法。该方法不仅可以有效地进行社团的检测,而且可以发现社团之间的重叠部分。对一个科研合作网络的实际数据进行仿真,实验结果表明该算法是可行的。  相似文献   

11.
当前PCB板缺陷检测存在检测效率低、漏检或误检率高、检测精度不够等问题,以YOLOv5s为基础算法,提出改进算法YOLOv5s-DS。该改进算法首先通过融入DSConv深度可分离卷积进行特征提取,降低网络参数计算量。其次,采用SIOU损失函数替换GIOU损失函数,提升算法精度,加快收敛速度。研究结果表明,该改进算法有效地提升了PCB板缺陷检测的精度和检测速度,降低了漏检率,为PCB板缺陷检测提供了参考。  相似文献   

12.
语义主路径分析方法在改进传统主路径分析法中主路径内容单一、主题一致性较差等不足的同时,留下了两个缺陷,即所选主路径在语义空间的位置可能偏离主题聚簇中心、不同主路径的主题区分度并不明显。本文在语义主路径分析方法的基础上,提出一种逐步优化的主路径选择方法,即将主题聚簇密度和路径遍历权重进行叠加形成复合密度,通过调节复合密度中两个要素的比重来优化主题聚簇中心的定位,当聚簇中心的位置变化收敛后,将位于不同主题聚簇中心的路径作为结果输出。将本文方法分别用于电动汽车锂离子电池专利引文网络和材料科学领域高影响力论文引文网络,实验结果显示,本文方法所产生的多条主路径不仅在主题聚簇中的布局更加合理,而且选取不当主路径的可能性也大大降低,从而验证了本文方法的有效性。  相似文献   

13.
本研究在总结现有以共链分析和社会网络分析为主的学术网络局部结构识别方法的基础上,提出了改进的两步式K核分析方法,首次引入了复杂网络中的社区识别算法进行链接网络的分割,并尝试通过适用性评测验证快速聚类算法在同质Web链接网络的主题结构识别方面的有效性.最后的实验结果表明,本研究提出的改进K核分析方法可以有效地发现存在于链接网络中的主题聚类现象;同时研究中引入的快速聚类算法对以93所大学网站进行了聚类并获得六个主题类.通过聚类准确率指标计算,该聚类方法的平均准确率为72%.以上结论证实了本研究中采用的从链接关系度量,数据矩阵构建、到链接网络分析的方法体系是有效的.  相似文献   

14.
针对传统文本分类算法在向量空间模型表示下存在向量高维、稀疏以及忽略特征语义相关性等缺陷所导致的分类效率低和精度不高的问题,以知网(HowNet)为知识库,构建语义概念向量模型SCVM(Semantic Concept Vector Model)表示文本,根据概念语义及上下文背景对同义词进行归并,对多义词进行排歧,提出基于概念簇的文本分类算法TCABCC (Text Classification Algorithm Based on the Concept of Clusters),通过改进传统KNN,用概念簇表示各个类别训练样本,使相似度的计算基于文本概念向量和类别概念簇。实验结果表明,该算法构造的分类器在效率和性能上均比传统KNN有较大的提高。  相似文献   

15.
支持向量聚类(Support Vector Clustering, SVC)算法主要分为两个阶段:训练阶段和聚类分配阶段.由于需要计算邻接矩阵,聚类分配阶段消耗的计算时间远比训练阶段多.本文在计算邻接矩阵前先利用核矩阵对数据进行初始分类,在每个初始类中寻找一个代表点.因为代表点和它所在的初始类拥有相同的簇标号,所以只需计算这些代表点集上的邻接矩阵.给每个代表点分配一个簇标号,代表点所代表的初始类内的数据点也就获得相同的簇标号,这样将有效减少聚类分配的时间.数值实验结果表明,本文提出的改进SVC算法不仅显著改善了SVC算法的时间性能,而且在聚类精度上也有一定程度的提高.  相似文献   

16.
无线传感器网络路由协议主要考虑如何针对不同的应用和网络技术,在不损害数据传输的前提下采用有效的路由算法,实现整个网络的生命周期最大化。提出了无线传感器网络路由协议分类方法,然后着重分析了当前一些较为重要的路由协议的核心路由机制,对这些协议的特点进行了比较,最后展望了未来这一研究方向的发展趋势。  相似文献   

17.
针对传统微博网络用户影响力度量方法中用户关系不明确、时间特征不明显的问题,从网络结构、交互行为和时间3个角度考虑影响力的个体差异,提出一种基于改进HITS算法的微博用户影响力计算方法。该方法以用户间动态交互行为作为切入点,选择其动态交互强度作为改进算法的边权重,通过sigmoid函数对中心值进行修正,整合用户的权威值和中心值量化用户影响力,提高算法的适应性,计算结果更为合理,为微博用户影响力计算提供了新的思路。以新浪微博为实验对象,实验结果表明,该方法相对于传统影响力计算方法,在DCG值、查准率、召回率和F值评价指标方面均有所提升。  相似文献   

18.
[目的/意义] 旨在解决中文名称规范联合数据库检索系统CNASS的检索结果集记录量大且杂散的问题,实现其检索服务的关联聚簇功能。[方法/过程] 基于FRBR-LRM框架将个人名称规范记录转换为实体-属性-关系的RDF表示,利用记录内嵌的外部LC记录号重定向到VIAF记录,对原记录的作品关系等属性进行扩展。设计中文同名个人规范记录识别与聚簇算法,充分利用扩展后的作品关系,提高记录识别和聚簇的效率。[结果/结论] 选取300个人名,在CNASS中进行检索,对检索结果集运行算法,统计分析每个检索结果集的聚簇数和最大聚簇内记录数,综合计算聚簇效率指标,验证了本文聚簇算法的有效性。  相似文献   

19.
胡漠  马捷  张云开  武博 《情报学报》2020,39(1):47-56
智慧政府是电子政务的下一代更迭,受到各国的广泛关注。智慧政府可以通过各部门间的信息协同提升城市运行管理的效率。当前对智慧政府信息协同的研究主要集中于研究智慧政府信息协同的机制,少有对智慧政府信息协同网络结构现状进行识别与分析的研究。本文采用命名实体识别的方法基于目标数据源(智慧政府相关政策文件)中识别出的中国智慧政府信息协同网络的节点(政府部门)数据及节点关系(各个政府部门间的信息协同关系)数据,得到中国智慧政府信息协同网络结构,并对这些数据进行可视化处理。在此基础上采用社会网络分析中的度中心性方法,把各个节点按其对整个网络影响力的强弱排序;采用k-plex分析方法,识别出对整个网络具有较强影响力的节点。研究结果显示,中国智慧政府信息协同网络共包含34个节点和355组节点关系。在节点中,国务院节点对整个网络的影响力最强,中国气象局节点对整个网络的影响力最弱。在节点关系中,国家发展和改革委员会节点与国务院节点间的节点关系对整个网络具有较强的影响力,像这样具有较强影响力的节点关系共28组。本研究得到的结果可用来指导今后中国智慧政府信息协同网络优化与发展的侧重方向。  相似文献   

20.
[目的/意义] 通过构建二模复杂网络模型,揭示隐藏在海量文献中的隐性知识。[方法/过程] 通过NetworkX复杂网络工具包,依据任意两个节点的共现关系构建二模复杂网络模型;对网络模型中节点的共现关系进行加权,计算网络的拓扑信息并进行AP聚类,提取节点间的直接关系;采用AUC方法对AA、JC、加权改进的wAA和wJC等4种链路预测算法进行评价,遴选出最合适的预测算法,并对复杂网络的隐性关系进行预测分析。[结果/结论] 以潜在药物靶点挖掘为例进行的实证研究结果表明,wAA链路预测算法为最优的链路预测算法;二模复杂网络模型、指标和方法体系在美国化学文摘社数据库中的药物靶点挖掘中具有一定的有效性。下一步计划在其他数据库中或其他研究领域中进行尝试,以进一步验证该模型的通用性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号