首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
余润海 《考试周刊》2009,(24):181-181
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。  相似文献   

2.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

3.
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和Web使用挖掘的基本概念。结合对Web结构挖掘中的PageRank算法和Web使用挖掘的主要步骤和算法的研究后,本文提出了一种融合这两种Web挖掘算法的一种新的、综合的Web挖掘算法。  相似文献   

4.
Web数据挖掘在搜索引擎中的应用   总被引:1,自引:0,他引:1  
分析了搜索引擎的结构组成,从Web的结构挖掘、内容挖掘、使用挖掘3方面对Web挖掘在搜索引擎中的应用进行阐述。  相似文献   

5.
介绍了一个基于Web挖掘技术的财经类搜索引擎的实现的关键技术,提出了类别向量的概念以及如何将Web结构挖掘和内容挖掘结合起来,并利用改进的VSM技术实现网页自动分类.  相似文献   

6.
提出了一种基于Lucene评分机制的PageRank改进算法,实现两者之间算法的有效互补,并利用Lucene框架搭建一个校园网搜索引擎,用以验证新算法的特性.  相似文献   

7.
基于Web超链接分析对当前存在的主流算法PageRank与HITS作了研究.主要讨论了PageRank算法存在评价下滑与评价泄漏的缺陷;简略介绍了HITS算法在主题相关度方面存在的问题;对上述缺陷做出了修正并提出了改进方向.  相似文献   

8.
互联网的迅速发展,搜索引擎也引起了更多人的关注,但主题搜索引擎发展还不够成熟,在国内,它的研究正处于发展阶段,发展缓慢、数量少,用户还不满意.本文提出了一种基于主题预分类的PageRank算法,与传统PageRank算法比较,经验证,该方法在一定的主题下可以提高系统的查准率.  相似文献   

9.
Web中存在着大量的、丰富的超链接.挖掘链接结构可以有助于提高Web信息检索的精度、发现潜在的Web社区.全面分析了基于Web链接结构的挖掘算法及其优缺点.并对挖掘算法在Web潜在社区发现中的应用作了探讨.  相似文献   

10.
Web挖掘技术是将传统的数据挖掘技术与Web技术相结合。本文研究分析了与Web挖掘有关的几个重要问题,并详细论述了web挖掘在个性化搜索引擎中的应用。  相似文献   

11.
Web日志挖掘是对用户与Web服务器在交互时产生的数据,采用数据挖掘技术发现隐含的规律性知识。首先对Web日志挖掘进行了概述,重点研究了关联规则算法中的Apriori算法,并对Apriori算法进行了改进,最后给出具体实例。  相似文献   

12.
介绍电子商务和Web数据挖掘的概念,并介绍Web使用挖掘中应用最多的技术——Web日志挖掘.重点阐述了日志挖掘算法——关联规则的有关知识,以及改进的频繁项目集生成算法Apriori和强关联规则生成算法,并结合实例进行了分析研究.  相似文献   

13.
随着www的广泛应用及相应的Web技术的出现,数据挖掘的研究进入了基于Web的新阶段.文章阐述了web数据挖掘的特点,Web数据挖掘的类型以及Web数据挖掘的技术在搜索引擎、电子商务、网络设计中的应用.  相似文献   

14.
目前搜索引擎最重要的事情之一就是如何使搜索引擎快速准确地从庞大的网页数据中获取所需资源的需求。本文重点阐述了搜索引擎的Web Spide(r网络蜘蛛)搜索器的搜索策略和搜索优化措施,提出了改进搜索引擎的Web Spi-der的方法,改进后的Web Spider能够更有效地发现和搜集信息。为搜索引擎进行信息搜集,高效、稳定的Web Spider保证了为用户提供的网上信息的全面性和有效性。  相似文献   

15.
该文构建了基于Web使用挖掘的个性化教育资源推荐系统原型,讨论了Web使用挖掘技术在教育资源网站中的应用.提出了改进的基于引用时长的事务识别方法。并采用改进的频繁访问路径挖掘算法挖掘用户热门访问路径,进一步主动推送用户感兴趣的资源,提高系统的个性化服务水平.  相似文献   

16.
基于Web挖掘的教学资源搜索引擎的模型设计研究   总被引:1,自引:0,他引:1  
本文首先介绍了基于Web挖掘的搜索引擎研究现状,提出了教学资源搜索引擎体系模型结构,对其中搜集器、控制器、教学资源数据库、索引器、检索器、用户接口、用户行为日志数据库等核心组成部分涉及的关键问题给出了解决方案。  相似文献   

17.
搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术.不断改进搜索引擎的性能,提高搜索结果的查准率和查全率是搜索引擎发展的目标.其中对于搜索结果的排序是一个重要的研究领域.在对一些排序算法的研究和对校园网特点分析的基础上,提出了一种基于校园网搜索引擎的改进算法,结果证明能更好的计算网页相关度,提高查询效率.  相似文献   

18.
针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。  相似文献   

19.
PageRank算法是Google商业应用的关键技术之一。探讨PageRank算法的原理、优缺点,基于连接本身的属性特点,赋予链接不同的权重,提出基于链接本身属性的算法改进思想。数据验证表明,改进的算法可以使得重要的网页排名提前,改进搜索结果。  相似文献   

20.
事务识别在Web日志挖掘步骤中至关重要,如果没有高效的识别算法,挖掘的效率将大打折扣。本文详细研究了事务识别的两种模型,介绍并改进了基于最大向前引用模型的识别方法MFP算法,同时对这两种方法进行了比较,结果表时,改进后的MFP算法具有更高的挖掘效率。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号