首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
网络爬虫是搜索引擎的一个基本组件,网络爬虫抓取页面的效率直接影响搜索引擎提供的服务质量。除了可以通过改进网络爬虫的爬行策略来提高网络爬虫效率之外,也可以通过优化网络爬虫程序某方面的设计来消除特定的效率瓶颈。通过对网络爬虫结构和实际运行数据的分析,针对爬虫的DNS解析瓶颈,设计了一种带缓存异步域名解析器模型,并通过实验和一般DNS解析器模型进行了比较,实验结果证明这种模型对于减少程序等待解析域名的这一操作时间十分有效,显然也能够提高爬虫的整体效率。  相似文献   

2.
爬虫是搜索引擎的重要组成部分,它决定了搜索引擎的性能,而Larbin正是一种高效的网络爬虫。首先分析了Larbin的设计结构,再由对其核心的算法Bloom Filter进行了研究,并对其提出了改进。最后是关于Larbin优化的实现。  相似文献   

3.
搜索引擎研究新技术   总被引:2,自引:0,他引:2  
介绍了近期两类国内搜索引擎技术的研究状况:爬虫系统性能优化技术研究及高级文件搜索引擎核心技术研究。爬虫系统性能优化侧重于:对爬行方式的优化实现海量信息源的高效索引;对URL数据库存取算法的优化提高用户检索的响应速度。高级文件搜索引擎研究是通过对字符串匹配的扩展、属性过滤的扩展、查询结果优化排序、输出结果的优化选择等7种核心技术的有效结合,丰富了文件搜引擎的功能。  相似文献   

4.
覃睿 《科研管理》2015,36(7):137-144
基于国家创业系统现有研究成果,对创业既是一种现象又是一个过程的认识,构建基于创业过程的国家创业系统概念框架及评价模型,从GEM-2012、DEDI-2012/2013和GCI-2012/2013中选取43个国家为样本及相关数据,运用可变规模收益条件下的非径向链式网络DEA方法,对国家创业系统效率进行综合评价。研究发现,对于效率驱动型样本和全部样本,我国国家创业系统及其节点都是无效的,其中非正式社会网络、商务环境、市场规模、胜任的人力资源和社会对创业态度五个投入要素需改进空间最大。因此,要提升我国国家创业系统综合效率,极为重要的是改进社会对创业的态度以提升创业意向形成效率,大幅度改进非正式网络、商务环境、市场规模和胜任的人力资源等要素,令更多具有创业意向的潜在创业者做出创业决策,开展创业活动。  相似文献   

5.
唐淑香  何琳 《现代情报》2010,30(2):120-122
文献传递服务是一个系统工程,必须运用系统科学的思维和方法来研究。采用系统论的基本原则,对文献传递服务的整体性、关联性、有序性和动态性等系统特性进行分析,提出通过整合文献传递系统内各要素、优化系统结构来提升文献传递服务质量和效率。  相似文献   

6.
检测器是计算机免疫系统中重要的组成部分,检测器的改进可以直接有放地提高免疲系统的性能和效率.本文研究了基于系统调用的计算机免疫系统中检测器的构造方法,通过改进循环序列的置换算法来处理嵌套循环序列,以提高检测器的准确度,并使用遗传算法优化了检测器规则库.  相似文献   

7.
网络和各种新媒体、自媒体的快速发展使得各种地震不良言论散布的更加快速和隐蔽,极易造成社会群体性恐慌,严重影响了社会的正常生产生活秩序。本文通过基于主题爬虫的网络地震谣言源信息获取研究,对通用爬虫和主题爬虫进行了比较,简要叙述了主题爬虫的模块结构和几种算法,最后以地震谣言主题为例进行了应用研究。结果表明,地震谣言主题爬虫具有较好的信息采集和数据挖掘效率,为及时制止地震谣言的散播并采取相关决策提供了数据理论基础。  相似文献   

8.
通过分析开源网络爬虫Heritrix的工作原理及架构,针对Heritrix开源爬虫只能对全网站进行通爬的特点,对Heritrix进行改进,增加了基于Hash算法的增量式抓取模块。实验表明,改进的Heritrix能够有效实现对网页的增量式抓取。  相似文献   

9.
针对于传统的二叉树算法,利用的都是递归函数。由于递归函数极易造成栈堆溢出,导致二叉树的大小有一定的限制,同时对于空间的浪费较大,而采用括号表示法可以较好地解决这个问题。本文对于括号表示法又进行了进一步的优化,使其能够更完善地以字符串的方式记录一个二叉树的所有信息。通过遍历字符串,改进了查询二叉树各种数据的算法的效率,为优化二叉树算法提供了借鉴。  相似文献   

10.
作为火力发电厂的核心组成部分,汽机热力系统的热能利用率对发电厂的整个效率有着重要的影响。但就目前来看,一些汽机热力系统的能效显然不高,以至于对机组效率影响很大。而对汽机热力系统的运行进行优化,是提升汽机效率的有效途径。因此,基于这种认识,本文对汽机热力系统的运行优化问题进行了研究,以便为关注这一话题的人们提供参考。  相似文献   

11.
针对当前可用输电能力计算存在着易早熟、收敛速度慢等问题,提出了一种改进的人工鱼群算法进行求解,提高了计算结果的准确性、收敛性能以及计算速度。人工鱼群算法是群智能随机全局优化技术,该算法引入了禁忌搜索算法中的记忆功能,可以有效避免迂回搜索并提高计算的效率。在对人工鱼搜索的机制进行研究的基础上,对寻优行为进行改进,采用最好解优先选择前进的路径并以排序选择的方式接受劣解,从而进一步提高算法的效率。修改过的IEEE 30节点系统的计算结果表明,改进人工鱼群算法用于可用输电能力计算是有效的,具有良好的全局收敛性能和较高的计算效率。  相似文献   

12.
关联规则挖掘是数据挖掘领域中的一个非常重要的研究内容,其主要目标就是发现数据库中一组对象之间某种关联。频繁项集挖掘是关联规则挖掘的关键步骤,它在很大程度上决定了关联规则挖掘的效率。介绍了Apriori算法及其算法改进。该改进算法对剪枝步进行了优化,提高了连接效率,并且不断减小数据库的规模,去掉无效事务,减少了每次扫描数据库所花费的时间,提高了算法效率。经过试验论证,性能比原有算法提高,具有一定的实用性。  相似文献   

13.
本文针对入侵检测中多模式匹配算法,提出的观点。在计算机网络安全行业起到提升检测效率作用。如付诸现实将减少入侵检测系统规则库特征值匹配时间。随着互联网的快速发展,Linux操作系统得到广泛应用的同时网络入侵的攻击手段也在不停变化,入侵检测系统可将捕捉到的数据包与已知的网络入侵特征库进行比对,进而发现入侵行为。AC算法是多模式匹配算法之一,它的优点在于能同时进行多个模式串的匹配搜索,缺点是会出现多次没有必要的比较,影响了入侵检测系统的效率,为了提高匹配效率,本文根据AC算法的有限状态自动机构建原理,利用BM算法的跳跃思想,优化文本串位移,提出了一种双向AC算法和BM算法结合的改进算法。根据实验结果表明此算法有效的降低了匹配时间。  相似文献   

14.
科技资源的可靠性调度问题关系到科研立项和科研项目进度管理,研究一种可靠的科技资源调度和网络构架算法,采用无向图分析方法进行B/S网络结构设计,提高系统的稳定性。提出一种基于B/S网络构架的科技资源可靠性调度算法,计算各传输节点在数据分发中自身对对方的直接信任值和间接信任值,根据合成法则产生综合信任值,实现资源调度模型设计。进行基于可变步长滤波处理单元滤波的资源调度算法设计,基于效益最大化的原则,得到科技资源调度的约束模型,实现算法改进。仿真结果表明,该模型能有效减少科技资源调度的聚集延迟,提高科研课题管理和立项中的资源共享效率,资源分配和调度的可靠性好。  相似文献   

15.
网络信息时代所要面对的是急剧膨胀的信息量,当前的互联网信息规模已经是集中式爬虫无法适应的,单机爬虫逐步开始被分布式爬虫所取代,在信息的采集中,高性能的爬虫系统才是研究的重点。文章则对分布式爬虫系统进行了介绍,针对其设计以及实现进行了分析论述。  相似文献   

16.
本文从博弈论的视角研究中国科学技术大学图书馆的图书预约系统。调查发现,图书预约系统的效率较低。我们建立一个博弈模型,推导相关行为人的最优行动路径,探究该预约系统效率低下的原因,并根据模型结果给出相应的改进建议。  相似文献   

17.
资源调度是当前云计算研究的热点,但是云计算中的虚拟节点的资源调度存在效率低,稳定性低的问题。针对这种情况,本文首先建立云计算环境下的资源调度模型,在模型中引入了优化后的蝙蝠算法,优化中引入混沌算法中的立方映射函数,对蝙蝠的个体进行混沌优化,同时缩小了搜索空间,加快了收敛速度。通过在Cloudsim平台上仿真实验表明,该算法在性能上、资源调度效率和任务调度方面都有很大改进,有效提高了云计算系统的资源调度能力。  相似文献   

18.
在研究和剖析关联Apriori算法的基础上,针对Apriori算法中的瓶颈,提出了一种优化算法,从算法的计数、连接和减枝等方面进行优化,快速搜索频繁项集,从而提升算法效率.  相似文献   

19.
为了满足人们日益增长的出行需求,跨学科的智能交通系统应运而生。最短路径分析是GIS车辆诱导系统应用的关键问题,Dijkstra算法是解决该问题的常用算法。文章结合二树Dijkstra算法的思想和现代多核多线程的技术,对Dijkstra算法进行了优化与改进,并对该算法在车辆诱导系统中的应用进行了探讨。该系统以桂林市为例模拟了最短路径搜过程,证明该算法的高效性和实用性。  相似文献   

20.
决策树算法是数据挖掘系统中一个重要的分类算法,选择合理而有效的测试属性以及对决策树进行适当的修剪是决策树算法的关键内容之一。将决策树算法引入教务管理挖掘系统,并对决策树测试属性的选择算法以及预剪枝算法进行改进。以九江学院学生四级考试信息为例,结果表明改进的决策树算法对于数据挖掘更具可靠性和有效性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号