首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 765 毫秒
1.
郑泳 《教育技术导刊》2010,9(7):122-123
网络蜘蛛搜索策略的研究是近年来专业搜索引擎研究的焦点之一,如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求是目前所面临的重要问题。重点阐述了搜索引擎的Web Spider(网络蜘蛛)的搜索策略和搜索优化措施,提出了一种简单的基于广度优先算法的网络蜘蛛设计方案,并分析了设计过程中的优化措施。  相似文献   

2.
步入信息时代,信息资源的重要性日益凸显,而搜索引擎作为人们获取信息的重要手段,其便捷性是有目共睹的。如何加速搜索引擎对自己网站的收录频率,以及怎样设计网页才能最大限度地吸引搜索引擎派出的“网络蜘蛛”(Web Spider),其实质是一种“电脑机器人”(Computer Robot),就成为每一个网站制作者和信息发布者最关心的话题。下面笔者就自己的制作体验和研究学习,简单谈谈吸引搜索蜘蛛的主要方法。  相似文献   

3.
搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术.不断改进搜索引擎的性能,提高搜索结果的查准率和查全率是搜索引擎发展的目标.其中对于搜索结果的排序是一个重要的研究领域.在对一些排序算法的研究和对校园网特点分析的基础上,提出了一种基于校园网搜索引擎的改进算法,结果证明能更好的计算网页相关度,提高查询效率.  相似文献   

4.
垂直搜索引擎又叫专题搜索引擎、专业搜索引擎。主要研究了下一代的搜索引擎——垂直搜索引擎,并基于Lucene技术开发了一个垂直搜索引擎,对信息检索的速度和最终结果的排序都进行了改进。同时给出了专业网络爬虫Spider的算法。  相似文献   

5.
在资源越来越丰富的校园网上高效地搜索信息,Web搜索引擎服务是必不可少的。本文介绍了搜索引擎的一般架构体系和Lucene——一款使用Java语言编写的全文搜索引擎开发工具包;然后结合MVC框架和JSP Servlet JavaBean技术将Lucene引入具体实践,实现并提供了一个校园网信息搜索平台。  相似文献   

6.
在资源越来越丰富的校园网上高效地搜索信息,Web搜索引擎服务是必不可少的。本文介绍了搜索引擎的一般架构体系和Lucenr一款使用Java语言编写的全文搜索引擎开发工具包;然后结合MVC框架和JSP+Servlet+JavaBean技术将Lucene引入具体实践,实现并提供了一个校园网信息搜索平台。  相似文献   

7.
Google Book Search API在Web OPAC书目查询服务中的应用   总被引:1,自引:0,他引:1  
通过使用Google Book Search API中的图书搜索链接和嵌入式浏览器API,在Web OPAC书目查询服务中嵌入Google图书搜索引擎进行图书搜索,可以增强Web OPAC书目查询服务功能,从而为快速检索信息提供便利。  相似文献   

8.
移动互联网、云计算、大数据技术的发展和应用使人类社会进入"互联网+"时代,人们可以通过互联网搜索引擎查询自己需要的信息资源,实现网络购物、在线教育、移动医疗等。目前,互联网容纳了海量的多媒体图片资源,基于内容的Web图片搜索已经成为搜索引擎的研究热点之一,搜索引擎已经引入了神经网络、遗传算法、支持向量机等搜索算法,提高了Web图片搜索的成功率和效率。  相似文献   

9.
一、什么是搜索引擎搜索引擎是一个对互联网上的信息资源进行搜集整理,然后供你查询的系统,它包括信息搜集、信息整理和用户查询三部分。二、搜索引擎的类型按搜索机制、搜索内容和包含搜索工具的数量分别划分为三类搜索引擎。三、搜索引擎的使用技巧搜索引擎可以帮助我们方便快速地查询网上信息,但是当你输入关键词后,出现了成百上千个查询结果,而且这些结果中并没有多少你想要的东西。面对着一堆信息垃圾,这时你的心情一定很沮丧。不要难过,这不是因为搜索引擎没有用,而是由于你没能很好地驾驭它,没有掌握它的使用技巧,才导致这…  相似文献   

10.
《中国教育网络》2008,(6):36-36
爬虫是搜索引擎赖以提供信息给用户的基础,是搜索引擎的重要组成部分。通过爬虫所搜集到的网页,搜索引擎建立相应的索引,从而使得用户可以搜索到相应的网页。  相似文献   

11.
1994年,万维网的出现,使得信息进入了一个超高速膨胀的时期。作为一个新的信息源,它给信息检索领域及检索技术带来了新的发展机遇和挑战。搜索引擎是一种在 Web上的应用系统,通过某种策略和方法对互连网上的信息进行搜集和整理后,为用户提供查询服务。本文描述了搜索引擎的现状,分析并介绍搜索引擎的分类和实现的基本原理。  相似文献   

12.
针对目前常用搜索引擎在查询时返回结果数量巨大且杂乱无章的现象,在Web客户端为实现对用户的个性化信息服务设计了一种基于用户兴趣的搜索系统。利用用户的兴趣对于用户提出的搜索条件进行处理,再通过常用的搜索引擎进行查询,并将得到的结果进行二次排序,同时通过反馈信息不断更新用户的兴趣,以满足用户不断变化的需求。实验证明这样在保证了查全率的基础上,提高了查准率,从而提高了搜索效率。  相似文献   

13.
搜索引擎的诞生为网络用户提供了快速高效的搜索工具.一面是种类繁多、功能齐全的搜索引擎和存储大量信息的网页,另一面却是用户找不到自己所需信息.掌握各种搜索引擎基本搜索技能,灵活运用搜索技巧,总结搜索经验,使搜索引擎真正地为网络用户服务.  相似文献   

14.
针对目前常用搜索引擎在查询时返回结果数量巨大且杂乱无章的现象,在Web客户端为实现对用户的个性化信息服务设计了一种基于用户兴趣的搜索系统。利用用户的兴趣对于用户提出的搜索条件进行处理,再通过常用的搜索引擎进行查询,并将得到的结果进行二次排序,同时通过反馈信息不断更新用户的兴趣,以满足用户不断变化的需求。实验证明这样在保证了查全率的基础上,提高了查准率,从而提高了搜索效率。  相似文献   

15.
目前,针对网上资源日益丰富却检索困难的问题,如何在信息的海洋中搜索有用的信息,从而将这些隐性知识转化为显性知识,已成为众多信息工作者研究的重要课题。基于搜索引擎的个性化系统就是为解决这一问题而提出的。对于农业资源的搜索,需要系统智能化地理解用户的信息需求,实现真正意义上的个性化服务。本文首先详细介绍了基于因特网的搜索引擎的系统结构,然后从索引引擎、Web服务器几个方面进行详细的说明。  相似文献   

16.
为提高通用搜索引擎对医学学科及主题的覆盖率,在开源搜索框架Nutch平台上,通过构建医学词典,结合中文分词插件,构建了一个面向医学信息的垂直搜索引擎,并详细介绍了改进后的系统功能和体系结构。相对于通用搜索引擎,该改进提高了医学信息判别的准确度和效率,减少了搜索结果冗余,同时提高了系统对于互联网复杂环境的处理能力。  相似文献   

17.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

18.
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的轨迹,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,用户必须尝试用所有搜索引擎去找出他所要的信息。最坏的是每个引擎互相覆盖,用户会重复发现一条信息。针对现有单个引擎搜索的限制,论文提出了针对多Web源的网络爬虫的实现,将现有搜索引擎上的网页信息进行抽取,过滤、去重、排序,进行信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。  相似文献   

19.
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法,通过实验证明,改进后的算法可以使搜索引擎的性能得到极大的提高。  相似文献   

20.
多媒体主题搜索指在Web中搜索与主题相关的,并且包含多媒体的网页。目前各大搜索引擎(Google、百度)相继推出了多媒体搜索引擎,主要是利用网页中的相关文本提取描述多媒体信息的关键词进行多媒体信息检索,这种搜索引擎能够直接、快速地从Web中寻找多媒体资源。但所搜索得到的网页往往有大量的重复,根据中国互联网网络信息中心2008年发布的统计报告显示,  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号