首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
为解决专业元搜索引擎查准率问题,研究专业元搜索引擎返回网页的专业相关度。通过独立搜索引擎返回的网页集,深度寻找除网页在独立搜索引擎位置以外的其余信息,设计一种基于遗传算法的网页专业相关度模型,并探讨模型的实现原理以及实现过程。  相似文献   

2.
吴江  汤亚非 《情报理论与实践》2008,31(1):150-152,32
本文通过分析4个尝试网络书目控制的站内搜索引擎的功能和存在的不足,从网页书目控制标签的制作、互联网目录的建立、目录过滤垃圾信息的功能提出改进的办法,并探讨网络书目控制搜索引擎工作原理和要达到的效果.  相似文献   

3.
杨倩晨 《大众科技》2009,(5):41-42,61
互联网不断发展的今天,其开放、共享的特性使得越来越来的用户在网上寻找信息。从搜索引擎的概念、分类入手,介绍了搜索引擎的系统架构和运行机制。对搜索引擎的三个子系统:网页数据搜集子系统、网页数据整理子系统和查询服务子系统进行了深入的分析。.  相似文献   

4.
李志义 《现代情报》2011,31(10):31-35
网络爬虫对网页的抓取与优化策略直接影响到网页采集的广度、深度,以及网页预处理的数量和搜索引擎的质量。搜索引擎的设计应在充分考虑网页遍历策略的同时,还应加强对网络爬虫优化策略的研究。本文从主题、优先采集、不重复采集、网页重访、分布式抓取等方面提出了网络爬虫的五大优化策略,对网络爬虫的设计有一定的指导和启迪作用。  相似文献   

5.
孙静  赵恒永 《中国科技信息》2007,(11):138-139,141
文章介绍了搜索引擎网页快照系统的实现以及在安全性能方面的研究。当前的多数搜索引擎网站提供的网页快照,能够使用户更加快速和方便地访问较早时期的网页,但它们并没有对其中的网页安全进行判断。文章中的网页快照系统在实现网页快照的同时,通过建立网页脚本语言学习解释器,运用机器学习技术、词法分析技术等对网页上可能存在的不安全代码进行判断和去除,从而保证提供给用户的是尽量安全的网页快照。  相似文献   

6.
针对传统搜索引擎对频繁更新的博客网站实时性搜索较差的问题,提出一种基于RSS的博客搜索引擎的系统框架,采取分布式的思想采集和索引博客网页的RSS结构化数据,从而达到了对频繁更新站点的实时性搜索.也降低了搜索引擎的存储成本和数据冗余程度。  相似文献   

7.
自动分类在搜索引擎性能优化中的应用   总被引:9,自引:0,他引:9  
曹树金  杨涛 《情报科学》2004,22(2):213-219
本文论述了自动分类在搜索引擎中的作用,介绍了网页自动分类实现的方法,分析了网络自动分类系统的实例,最后展望了自动分类在搜索引擎中的应用前景.  相似文献   

8.
网络搜索引擎在网络信息资源查找中起到了重要的作用,它可以帮助人们从浩如烟海的网络信息中找到自己想要的信息。但是现在的搜索引擎技术并不完善,存在大量内容相同的冗余网页。冗余网页不但浪费了存储资源,还给用户的检索带来诸多不便。本文描述了一个搜索引擎去重Agent系统,由系统代替用户对搜索引擎结果页面进行信息抽取,对获得结果进行对比,并去除其中内容重复的冗余网页,将去重后的结果提供给用户,从而为用户节省时间和精力。  相似文献   

9.
林立  刘思得 《情报探索》1997,(4):28-28,30
中文网络搜索引擎是获取中文网页信息的有力工具,本文简要介绍中文搜索引擎悠游的特点,组成,信息资源以及检索方法。  相似文献   

10.
基于RSS的分布式博客搜索引擎的研究   总被引:2,自引:0,他引:2  
针对传统搜索引擎对频繁更新的博客网站实时性搜索较差的问题,提出一种基于RSS的分布式博客搜索引擎的系统框架,通过划分网络区域,采取分布式的思想采集和索引博客网页的RSS结构化数据,从而达到了对频繁更新站点的实时性搜索,也降低了搜索引擎的存储成本和数据冗余程度.  相似文献   

11.
段爱华  段焜 《大众科技》2007,(10):81-83
搜索引擎作为互联网上最主要的信息搜索工具,在各个领域都已得到广泛应用,而网络蜘蛛技术则是搜索引擎的关键.文章围绕网上信息搜索这一前沿性研究领域课题,结合搜索引擎框架的总体要求,实现了网络蜘蛛在互联网中的漫游,并将网页数据存储在本地数据库中,为以后智能搜索引擎的实现打下了良好的基础.  相似文献   

12.
针对传统的基于Web图的垂直搜索策略Authorities and Hubs,提出了一种融合了网页内容评价和Web图的启发式垂直搜索策略,此外,引入向量空间模型进行针对网页内容的主题相关度判断,进一步提高主题网页下载的准确率.实验表明,文中算法有效地提高了主题网页的聚合程度,且随着网页下载数量的增加,垂直搜索引擎的准确率逐渐递增,并在下载网页达到一定数量后,准确率趋于稳定,算法具有较好的鲁棒性,可以应用到相关垂直搜索引擎系统中.  相似文献   

13.
孙莉 《情报探索》2006,(2):111-115
Google搜索引擎以其独到的功能成为现今使用最为广泛的搜索引擎之一,其专利网页级别(PageRankTM)排名算法作为Google搜索引擎的核心技术,在Google搜索引擎中起着重要的作用。文章先从Google搜索引擎的特点和功能说起,再从距阵特征值的角度阐述PageRankTM算法排名的原理。  相似文献   

14.
曹淑华 《内江科技》2009,30(7):116-116,149
网页的数据采集是网络信息搜索引擎中对于相关信息与链接的获取过程。本文通过剖析网络搜索引擎中数据采集的基本方法和运行机制,并通过程序设计实现数据采集。  相似文献   

15.
搜索引擎检索技术及其优化策略   总被引:1,自引:0,他引:1  
何毅 《现代情报》2008,28(5):171-173
本文介绍了搜索引擎的基本工作原理,分析了搜索引擎检索技术及其衡量搜索引擎的标准--查全率和查准率,最后分析了搜索引擎检索结果中提高网页排名的优化策略.  相似文献   

16.
搜索引擎检索结果的网页组织技术及其优化策略   总被引:2,自引:0,他引:2  
张海涛  高松 《情报科学》2006,24(6):900-903
本文分析了搜索引擎检索结果的组织技术及其存在的不足,并对检索结果的组织技术进行了优化处理,最后分析了搜索引擎检索结果中提高网页排名的优化策略。  相似文献   

17.
搜索引擎作为互联网上最主要的信息搜索工具,在各个领域都己得到广泛应用,而网络蜘蛛技术则是搜索引擎的关键。文章围绕网上信息搜索这一前沿性研究领域课题,结合搜索引擎框架的总体要求,实现了网络蜘蛛在互联网中的漫游,并将网页数据存储在本地数据库中,为以后智能搜索引擎的实现打下了良好的基础。  相似文献   

18.
网络蜘蛛搜索策略的研究是近年来专业搜索引擎研究的焦点之一,如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求是目前所面临的重要问题。重点阐述了搜索引擎的Web Spider(网络蜘蛛)的搜索策略和搜索优化措施,提出了一种简单的基于广度优先算法的网络蜘蛛设计方案,并分析了设计过程中的优化措施。  相似文献   

19.
基于个性化信息推荐服务的Web搜索引擎技术综述   总被引:3,自引:0,他引:3  
李树青  崔北亮 《情报杂志》2007,26(8):98-101
现代互联网的高速发展给Web搜索引擎带来了新的挑战,改善用户的查询体验以便于用户从海量的网络信息资源中得到自己所需的内容,正在成为当代搜索引擎的主要发展方向.基于个性化信息推荐服务的搜索引擎正在快速得到人们的广泛关注.经过近几年来的不断研究,现在已经形成了四种主要的形式,分别依托于查询改进、个性化网页权重、个性化多元搜索引擎和个性化信息采集等技术.在对此综合介绍的基础上,指出了未来改进的方向.  相似文献   

20.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号