首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
由于现在Web上的信息量变得越来越大,单个的搜索引擎不可能包括整个网络的轨迹,网络爬虫的能力,索引数据库的大小,系统维护开销等,都限制了一个搜索引擎的查全率。因此,用户必须尝试用所有搜索引擎去找出他所要的信息。最坏的是每个引擎互相覆盖,用户会重复发现一条信息。针对现有单个引擎搜索的限制,论文提出了针对多Web源的网络爬虫的实现,将现有搜索引擎上的网页信息进行抽取,过滤、去重、排序,进行信息重组,可以获得更全面更符合人们需要的、个性化的数据结果。  相似文献   

2.
搜索引擎技术应用广泛。Lucene作为一个优秀的搜索引擎开源工具包,可方便实现相关搜索引擎功能。介绍了Lucene搜索引擎工具包,在此基础上,利用Lucene开发工具包,设计并实现了综合查询系统中搜索引擎功能。阐述了网络爬虫子系统、索引子系统和查询子系统3个模块功能。  相似文献   

3.
垂直搜索引擎又叫专题搜索引擎、专业搜索引擎。主要研究了下一代的搜索引擎——垂直搜索引擎,并基于Lucene技术开发了一个垂直搜索引擎,对信息检索的速度和最终结果的排序都进行了改进。同时给出了专业网络爬虫Spider的算法。  相似文献   

4.
基于主题搜索的主题网络爬虫,只抓取与用户主题相关的页面。在深入分析主题页面分布特征和主题相关性判别算法的基础上,提出了一个面向主题搜索的网络爬虫模型,它很好地克服了通用搜索引擎准确率偏低、信息内容相对陈旧、信息分布范围不均衡等不足。实验结果表明,尽管基于主题爬虫的搜索增加了内存使用率,但也成倍提升了搜索的准确性,提高了抓取效率以及抓取结果的利用率。  相似文献   

5.
门秀萍 《茂名学院学报》2011,21(6):51-53,57
由于单个搜索引擎所采用的排序算法和搜索范围不同,用户很难得到准确的结果信息;而元搜索引擎通过同时调用多个搜索引擎,在一定程度上提高了检索效果;垂直搜索引擎通过针对某一特定领域如医学、金融等为查询用户提供相关信息。本文针对多领域的信息检索,提出了将元搜索引擎与垂直搜索引擎相结合的方法,并构建了三种多域元搜索引擎,实验证明,与使用单独的搜索引擎相比,使用该搜索引擎能够获得更好的检索效果。  相似文献   

6.
垂直搜索引擎是针对某一个特定行业的专业搜索引擎,是搜索引擎的细分和延伸,可以反馈给用户更准确和更专业的查询结果.在高校的校园网信息检索应用领域,实现了基于Lucene技术的中文校园网垂直搜索引擎,其可以为用户提供专业的信息检索服务.  相似文献   

7.
以何种策略来访问web资源是搜索引擎研究的热点之一。通过比较通用搜索引擎和专业搜索引擎的搜索策略,针对"最好策略"的几种策略方案进行了优缺点的分析,总结了关于提高网络爬虫搜索效率的关键,旨在使人们对爬虫的搜索算法有一个全面大概的了解。  相似文献   

8.
垂直搜索引擎是针对某一个特定行业的专业搜索引擎,是搜索引擎的细分和延伸,可以反馈给用户更准确和更专业的查询结果.在高校的校园网信息检索应用领域,实现了基于Lucene技术的中文校园网垂直搜索引擎,其可以为用户提供专业的信息检索服务.  相似文献   

9.
针对互联网网内信息搜索效率低下问题,设计了以Redis数据库以及Map-reduce思想为核心的分布式搜索引擎框架。为了应对互联网信息时效性强、更新快、难以被准确检索的特点,基于该框架设计了分布式爬虫、分布式索引建立、分布式链接分析算法。该框架明显提高了信息处理的效率,为分布式搜索引擎的搭建提供有效模板。经过测试,与以基于其它主流框架搭建分布式搜索引擎相比,基于Redis的分布式搜索引擎在爬虫爬取、索引生成、链接分析性能方面均有提升。  相似文献   

10.
《中国教育网络》2008,(6):36-36
爬虫是搜索引擎赖以提供信息给用户的基础,是搜索引擎的重要组成部分。通过爬虫所搜集到的网页,搜索引擎建立相应的索引,从而使得用户可以搜索到相应的网页。  相似文献   

11.
Web1.0使我们的学习走进了数字化,通过互联网来解决问题,搜集知识进行自主学习,是一种面向Web的学习。Web2.0使我们可以发布自己的问题和计算机进行互动,主要体现的是一种交互式学习,是一种与Web的协作学习、探究式学习等。Web3.0是Web的一种个性化、服务性的推送学习,是一种在用Web的智能化的自适应个性化的学习平台。互联网的技术进步必将改善学习方式。  相似文献   

12.
数据挖掘技术的重点已经从传统的基于数据库的应用转移到了基于Web的应用。本文分析了Web挖掘的过程模型。对基于数据挖掘的Web挖掘系统的框架进行了设计研究。  相似文献   

13.
由于Web1.0技术的局限,使基于Web1.0的网络课程存在着诸多不足,诸如缺乏科学有效的人际交互的设计,指导、监控学习过程的学习活动设计较少,学习评价与反馈设计简单化等。随着Web2.0在教育领域的推广应用,其在网络课程建设中的优势越来越被学者们认同,Web2.0的理念、技术和应用为网络课程的教学设计带来了更多的可能性,为网络课程的更新换代提供了技术支持。  相似文献   

14.
Web3.0:挑战传统网络学习   总被引:2,自引:0,他引:2  
随着网络学习的普及,学习者对网络学习平台的要求也越来越高,传统的基于Web2.0建立的网络平台已经不能满足广大学习者的需求。Web3.0的出现以及它在网络学习方面所表现出的强大优势给传统的网络学习带来了新契机。  相似文献   

15.
网络社会,使人类的生活方式发生了前所未有的变化,同时也给写作带来了全方位的挑战。随着网络的普及,网络写作成为一种时尚的写作方式。  相似文献   

16.
Web挖掘研究   总被引:3,自引:0,他引:3  
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘。  相似文献   

17.
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

18.
基于Web网络编程的ASP技术   总被引:3,自引:0,他引:3  
文章主要介绍基于Web的网络编程ASP技术,重点介绍ASP的三个内置对象(服务对象,应用对象,会话对象)的调用以及ASP访问Web数据库技术的详细过程。  相似文献   

19.
随着计算机技术的普及与远程教育模式的不断探究和发展,基于Web的习题管理系统逐渐受到重视,越来越多的计算机专业人员、教育技术专家和学科专家开始通力合作,共同完成习题管理系统的开发。以实用性和教育性为基本原则,以学生中心模式为基础,从系统总体需求分析和系统各用户功能需求分析两个方面,对习题管理系统的主要功能需求进行了探讨。  相似文献   

20.
基于Web的实验室开放管理系统的设计与实现   总被引:2,自引:0,他引:2  
针对目前高校实验室开放管理信息化程度不高的缺点,设计并实现了一个基于Web的实验室开放管理系统。该系统采用MySQL+PHP进行开发,实现了实验课排课、实验室设备使用状态查询和预约等功能,并通过对被排课或预约的时段等信息的灵活处理和直观显示为用户操作提供便利。该系统已在中南民族大学部分学院推广使用,取得了较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号