首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法,通过实验证明,改进后的算法可以使搜索引擎的性能得到极大的提高。  相似文献   

2.
目前搜索引擎最重要的事情之一就是如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求。本文重点阐述了搜索引擎的Web Spide(r网络蜘蛛)搜索器的搜索策略和搜索优化措施,提出了改进搜索引擎的Web Spi-der的方法,改进后的Web Spider能够更有效地发现和搜集信息。为搜索引擎进行信息搜集,高效、稳定的Web Spider保证了为用户提供的网上信息的全面性和有效性。  相似文献   

3.
互联网的迅速发展,搜索引擎也引起了更多人的关注,但主题搜索引擎发展还不够成熟,在国内,它的研究正处于发展阶段,发展缓慢、数量少,用户还不满意.本文提出了一种基于主题预分类的PageRank算法,与传统PageRank算法比较,经验证,该方法在一定的主题下可以提高系统的查准率.  相似文献   

4.
搜索引擎的诞生为网络用户提供了快速高效的搜索工具.一面是种类繁多、功能齐全的搜索引擎和存储大量信息的网页,另一面却是用户找不到自己所需信息.掌握各种搜索引擎基本搜索技能,灵活运用搜索技巧,总结搜索经验,使搜索引擎真正地为网络用户服务.  相似文献   

5.
针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。  相似文献   

6.
PageRank算法是Google商业应用的关键技术之一。探讨PageRank算法的原理、优缺点,基于连接本身的属性特点,赋予链接不同的权重,提出基于链接本身属性的算法改进思想。数据验证表明,改进的算法可以使得重要的网页排名提前,改进搜索结果。  相似文献   

7.
门秀萍 《茂名学院学报》2011,21(6):51-53,57
由于单个搜索引擎所采用的排序算法和搜索范围不同,用户很难得到准确的结果信息;而元搜索引擎通过同时调用多个搜索引擎,在一定程度上提高了检索效果;垂直搜索引擎通过针对某一特定领域如医学、金融等为查询用户提供相关信息。本文针对多领域的信息检索,提出了将元搜索引擎与垂直搜索引擎相结合的方法,并构建了三种多域元搜索引擎,实验证明,与使用单独的搜索引擎相比,使用该搜索引擎能够获得更好的检索效果。  相似文献   

8.
提出了一种基于Lucene评分机制的PageRank改进算法,实现两者之间算法的有效互补,并利用Lucene框架搭建一个校园网搜索引擎,用以验证新算法的特性.  相似文献   

9.
提出了一种改进用户浏览行为的用户兴趣模型,该模型综合考虑了用户对页面的浏览行为、用户的长期兴趣和短期兴趣。将这种改进的用户兴趣模型应用于个性化搜索引擎系统中,详述了系统的基本框架、系统基本功能模块,开发了一个演示系统IUBPSES。模拟实验显示:利用该改进用户兴趣模型的搜索引擎系统进行关键词搜索,其搜索效果优于当前主流搜索引擎系统。最后,指出了需要改进和进一步研究方向。  相似文献   

10.
随着信息时代的到来,搜索引擎在为用户提供方便的同时,搜索结果也变得更加零碎,用户经常无法顺利找到自己需要的结果.为解决用户这个困惑,采用基于关联规则的推荐算法,通过用户搜索关键字,预测并向该用户推荐他可能感兴趣的TOP5Xbox游戏.  相似文献   

11.
搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术.不断改进搜索引擎的性能,提高搜索结果的查准率和查全率是搜索引擎发展的目标.其中对于搜索结果的排序是一个重要的研究领域.在对一些排序算法的研究和对校园网特点分析的基础上,提出了一种基于校园网搜索引擎的改进算法,结果证明能更好的计算网页相关度,提高查询效率.  相似文献   

12.
基于XML得出改进的语义表示法,能解决当前常用网络搜索引擎缺乏理解用户想法而导致查询结果不满意的问题。文档解析算法、模式匹配算法、生成XMLSE文档算法等几个基于语义搜索的核心算法,辅以人工标注和建立规则库,构成一个语义网络,能达到精确的搜索,提高搜索效率。  相似文献   

13.
PageRank以某个网页被指向的链接数为基础得到网页的权值,网络搜索引擎以PageRank为基础对网页进行排序.一个完整的搜索引擎由搜索器、索引器、检索器和用户接口构成.用搜索引擎模型可以解决交通线路规划、图书管理等领域中对大量数据需要进行优先级排序的实际问题.  相似文献   

14.
搜索引擎是一种互联网数据信息检索工具,它可以从复杂无序的信息中检索出用户需要的有用信息,将杂乱的信息变得有序、清晰。但由于网络上有着大量信息,搜索到的信息难免不够全面与精准,可能存在过多垃圾信息。为了很好地解决以上问题,一种新型的搜索服务模式——垂直搜索引擎系统应运而生。该系统可为用户提供最专业、及时的信息,并加强了搜索结果的精准性和全面性。  相似文献   

15.
针对当前的搜索引擎提供面向查询、而非面向用户的服务,从而导致搜索引擎无法满足用户个性化的需求这一问题,提出了一种基于PLSA的新方法,将面向查询词的搜索转变成面向用户的搜索.首先,通过分析用户查询历史和浏览记录建立代表用户模型的用户兴趣向量,在用户发出查询时用户的查询词根据用户兴趣向量被映射到兴趣分类上,最终根据面向用户排序算法将返回结果列表重新排序.实验表明该面向用户搜索系统能够充分考虑用户的偏好,从而更好地满足不同用户的信息需求.  相似文献   

16.
搜索引擎作为互联网中用户使用最多的信息服务项目,已深入到每一个网络用户中,而针对性和准确性更高的站内搜索也随处可见,但是对于其搜索原理及其实现方式却知之甚少,文中以通俗的语言介绍了站内搜索引擎的原理,以最简单的方式实现了专门站点内的信息搜索功能.  相似文献   

17.
随着21世纪信息技术的迅速发展,互联网信息大爆炸效应引发的信息盲区问题越来越受到人们关注。使用语义分析算法构建搜索引擎能够在很大程度上提高搜索效率,提升用户体验。探讨了语义分析算法在信息检索中的一些应用方法,以期为互联网平台开发提供一些思路。  相似文献   

18.
余润海 《考试周刊》2009,(24):181-181
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。  相似文献   

19.
《中国教育网络》2008,(6):36-36
爬虫是搜索引擎赖以提供信息给用户的基础,是搜索引擎的重要组成部分。通过爬虫所搜集到的网页,搜索引擎建立相应的索引,从而使得用户可以搜索到相应的网页。  相似文献   

20.
针对用户使用搜索引擎输入关键词查询信息时,由于输入法的原因或者不小心输入错误关键词等,致使搜索结果不符合用户预期的问题,提出基于搜索引擎日志的中文纠错方法。首先对用户网络日志展开研究,对数据进行预处理,将用户常见错误分为两大类:一类为拼音引起的错误,针对该类错误,参考并改进了基于拼音索引的中文模糊匹配算法进行纠错;另一类为多字、少字、异位及别字引起的错误,针对该类错误,设计了模糊匹配方法结合最小编辑距离方法进行纠错。经过实验验证,证明了该纠错方法的有效性,该方法能够一定程度上提升用户体验,满足实际工程需要。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号