首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
《中国教育网络》2008,(6):36-36
爬虫是搜索引擎赖以提供信息给用户的基础,是搜索引擎的重要组成部分。通过爬虫所搜集到的网页,搜索引擎建立相应的索引,从而使得用户可以搜索到相应的网页。  相似文献   

2.
一、选择合适的搜索引擎搜索引擎是专门帮助人们查询信息的站点,通过这些具有强大查找能力的站点,我们可以得到满意的答复。因为这些站点提供全面的信息查询和良好的速度,就像发动机一样强劲有力,所以人们就把这些站点称为“搜索引擎”。每种引擎都有不同的特点,只有选择合适的搜索引擎工具才能得到最佳的结果。通常的搜索引擎可以分为网页检索、分类检索两种。网页检索实际上是网页的索引,这类搜索引擎信息量大、更新及时,但返  相似文献   

3.
PageRank以某个网页被指向的链接数为基础得到网页的权值,网络搜索引擎以PageRank为基础对网页进行排序.一个完整的搜索引擎由搜索器、索引器、检索器和用户接口构成.用搜索引擎模型可以解决交通线路规划、图书管理等领域中对大量数据需要进行优先级排序的实际问题.  相似文献   

4.
为解决专业元搜索引擎查准率问题,研究专业元搜索引擎返回网页的专业相关度。通过独立搜索引擎返回的网页集,深度寻找除网页在独立搜索引擎位置以外的其余信息,设计一种基于遗传算法的网页专业相关度模型,并探讨模型的实现原理以及实现过程。  相似文献   

5.
搜索引擎优化是根据搜索引擎对网页的检索特点,让网站建设各项基本要素适合搜索引擎的检索原则,从而使搜索引擎收录尽可能多的网页,并在搜索引擎自然检索结果中排名靠前,最终达到网站推广的目的。作者在分析搜索引擎收录网页的原理和特点的基础上,提出了几点网站建设的SEO优化策略。  相似文献   

6.
搜索引擎优化(Search Engine Optimization,简称SEO)是一种利用搜索引擎的搜索规则来提高目的网站在有关搜索引擎内的排名的方式。是针对搜索引擎对网页的检索特点,让网站建设各项基本要素适合搜索引擎的检索原则,从而使搜索引擎收录尽可能多的网页,并在搜索引擎自然检索结果中排名靠前,最终达到推广网站的目的。  相似文献   

7.
由于DC元数据描述网络资源的优越性,基于DC元数据的搜索引擎系统能够克服传统搜索引擎无法理解网页描述语义、检索效率低的缺点。设计该系统最首要的模块就是自动搜集模块,如何自动搜集含DC元数据的网页,如何自动提取其中的DC元数据信息,并加以分析和处理,文章详细介绍了该模块的设计思路和具体的实现方法,并给出部分设计源代码。  相似文献   

8.
瑞典Umea大学博士生Ola Agren最近开发了一个算法,可以使搜索引擎更快地返回相关的结果。目前互联网上的搜索引擎,一般是使用某种算法为互联网上所有网页指定较高或较低的  相似文献   

9.
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.  相似文献   

10.
随着网页信息量的增大,通用搜索引擎已不能满足用户需求,因此,出现了垂直搜索引擎,主要介绍了垂直搜索引擎的定义,垂直搜索引擎与通用搜索引擎搜索的区别,以及垂直搜索引擎评估、应用和发展方向.  相似文献   

11.
多媒体主题搜索指在Web中搜索与主题相关的,并且包含多媒体的网页。目前各大搜索引擎(Google、百度)相继推出了多媒体搜索引擎,主要是利用网页中的相关文本提取描述多媒体信息的关键词进行多媒体信息检索,这种搜索引擎能够直接、快速地从Web中寻找多媒体资源。但所搜索得到的网页往往有大量的重复,根据中国互联网网络信息中心2008年发布的统计报告显示,  相似文献   

12.
提出一个基于Linux平台,通过C语言编程,采用模块化设计模式的小型搜索引擎.通过对目前搜索引擎核心原理及相关技术成果的研究分析,实现了网页获取子系统、索引子系统、检索子系统3大系统.分析了系统所采用的关键技术和方法,并在实验中验证了系统设计的有效性.  相似文献   

13.
主要介绍了主题搜索引擎、网络爬虫的基本概念和Heritrix系统的体系结构,分析了Heritrix的工作流程,在Heritrix框架的基础上进行扩展和优化。通过一个实例,实现了对京东网图书信息的抓取,为建立面向图书信息的垂直搜索引擎提供了网页信息资源。  相似文献   

14.
随着网络的飞速发展,网页数量急剧膨胀,近几年来更是以指数级进行增长,搜索引擎面临的挑战越来越严峻,很难从海量的网页中准确快捷地找到符合用户需求的网页。网页分类是解决这个问题的有效手段之一,基于网页主题分类和基于网页体裁分类是网页分类的两大主流,二者有效地提高了搜索引擎的检索效率。网页体裁分类是指按照网页的表现形式及其用途对网页进行分类。介绍了网页体裁的定义,网页体裁分类研究常用的分类特征,并且介绍了几种常用特征筛选方法、分类模型以及分类器的评估方法,为研究者提供了对网页体裁分类的概要性了解。  相似文献   

15.
SEO即SearchEnDneOptimization,中文的意思就是搜索引擎的优化。搜索引擎优化的主要作用是依据搜索引擎对于检索的作用特征,对网站的建设进行全面的优化使得网站中的各项功能要素能够更好地适应新的搜索引擎的检索,从而达到提高搜索引擎网页收录量的效果,并使得收录的网页在搜索引擎自然检索结果中处于较为靠前的位置,这样对于网站的推广是十分有利的。SEO技术的应用对于网站建设和推广方面有着很大的促进作用,因此,对于SEO的研究与分析是非常重要的。  相似文献   

16.
在图书馆电子文献检索中,搜索引擎可以为用户进行网络导航,帮助用户在大量的网络信息中快速查找所需的站点或网页,筛选出符合用户需求的有用信息。搜索引擎是专门为用户提供信息发布和信息查询服务的一种软件系统,其实它也就是一种网络数据库系统。  相似文献   

17.
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的信息资源,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,设计一个统一的搜索引擎查询界面,并能快速智能合并查询结果是一个挑战。针对现有单个引擎搜索的限制,提出了基于行块的正文摘要提取方法和基于词频的相似度模型实现了一个可扩展的多WEB源的网络爬虫,将现各搜索引擎上的网页信息进行抽取,过滤、去重、排序、信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。系统的测试结果表明我们的方法是比较有效的。  相似文献   

18.
从使用搜索引擎的角度,对于搜索引擎返回的结果,用户只关心那些包含信息的内容部分。以此为需要,本文研究了网页中信息部分识别技术,对于当今存在的各种网页中信息部分识别技术进行优缺点对比,并提出新的算法。针对网页中内容的特点,第一步将网页中的内容划分为块,第二步从划分出来的块中识别出内容。依据网页元素中的各种HTML特征和实际经验中不断调整规则和变量值,完成了对信息部分的识别,最后,通过实验证明本文提出的算法具有良好的效果。  相似文献   

19.
搜索引擎的诞生为网络用户提供了快速高效的搜索工具.一面是种类繁多、功能齐全的搜索引擎和存储大量信息的网页,另一面却是用户找不到自己所需信息.掌握各种搜索引擎基本搜索技能,灵活运用搜索技巧,总结搜索经验,使搜索引擎真正地为网络用户服务.  相似文献   

20.
搜索引擎的发展概况与趋势   总被引:1,自引:0,他引:1  
搜索引擎是随着网上信息不断丰富应运而生的一种检索工具。1994年,Internet上诞生了第一个搜索引擎W ebCraw ler,通过对网页做索引来提供检索服务。2000年,Google的出现使搜索引擎市场发生了新的变化。近年来,中文搜索引擎的发展快,数量多。搜索引擎的发展有以下趋势:数据库小型化,专业化;强化全文检索功能;检索智能化、服务个性化;语种多样化;元搜索引擎的发展;搜索服务等。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号