首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 125 毫秒
1.
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基础上提出了改进的PageRank算法,通过实验证明,改进后的算法可以使搜索引擎的性能得到极大的提高。  相似文献   

2.
搜索引擎是互联网资源搜索的入口,搜索的快捷性、准确性是搜索引擎的核心竞争力,如何提高竞争力是业内企业的工作重点。已有的搜索引擎算法中,最具代表性的就是PageRank算法,针对该算法的改进方法也有很多,但效果并不很理想。分析了已有PageRank改进方法的不足,立足于用户搜索行为信息挖掘,采用时序关联分析方法,将关联比例作为权值加入到PageRank计算公式中,改变平均分配权威值的计算方法,从而得到了改进的PageRank算法——TCPR算法,使得搜索排序结果更符合用户的信息需求。  相似文献   

3.
提出了一种基于Lucene评分机制的PageRank改进算法,实现两者之间算法的有效互补,并利用Lucene框架搭建一个校园网搜索引擎,用以验证新算法的特性.  相似文献   

4.
分析当前搜索引擎系统设计中应用蚁群算法的相关问题,以确保运用蚁群算法优化设计搜索引擎系统.结果证实,在搜索引擎系统中应用蚁群算法,仿真证明该算法在设计系统应用中具有有效性与优越性.结论表明,在搜索引擎系统中,应用蚁群算法,不仅能够优化搜索引擎系统中的搜索代价,还可以发挥蚁群算法的开放性与自我动态调整性,发挥积极应用价值.  相似文献   

5.
基于Web超链接分析对当前存在的主流算法PageRank与HITS作了研究.主要讨论了PageRank算法存在评价下滑与评价泄漏的缺陷;简略介绍了HITS算法在主题相关度方面存在的问题;对上述缺陷做出了修正并提出了改进方向.  相似文献   

6.
余润海 《考试周刊》2009,(24):181-181
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网页搜索中具体实现的方法。  相似文献   

7.
针对PageRank算法查准率和检索效率低的问题,通过增加用户点击率、网页发布时间以及主题内容相关度3个影响因子改进PageRank算法,提高用户查准率;利用MapReduce技术实现改进的PageRank算法,提高网页排序和检索效率;最后通过实验结果数据对比,发现用户检索效率和用户查询准确率有较大提高。  相似文献   

8.
PageRank以某个网页被指向的链接数为基础得到网页的权值,网络搜索引擎以PageRank为基础对网页进行排序.一个完整的搜索引擎由搜索器、索引器、检索器和用户接口构成.用搜索引擎模型可以解决交通线路规划、图书管理等领域中对大量数据需要进行优先级排序的实际问题.  相似文献   

9.
PageRank算法是Google商业应用的关键技术之一。探讨PageRank算法的原理、优缺点,基于连接本身的属性特点,赋予链接不同的权重,提出基于链接本身属性的算法改进思想。数据验证表明,改进的算法可以使得重要的网页排名提前,改进搜索结果。  相似文献   

10.
搜索引擎是随着Web信息的迅速增加,从1995年开始逐渐发展起来的技术.不断改进搜索引擎的性能,提高搜索结果的查准率和查全率是搜索引擎发展的目标.其中对于搜索结果的排序是一个重要的研究领域.在对一些排序算法的研究和对校园网特点分析的基础上,提出了一种基于校园网搜索引擎的改进算法,结果证明能更好的计算网页相关度,提高查询效率.  相似文献   

11.
分析现有电子商务网站的局限性及传统搜索引擎的区别,给出搜索引擎的六大模块的实现思想及模型,剖析基于语义的搜索算法的四大主要算法模块,并给出部分算法代码,设计与实现打折商品搜索引擎,最后利用四个测试指标与6大主流搜索引擎进行验证测试,测试结果表明本搜索引擎针对打折商品检索效果最优。  相似文献   

12.
针对专业网站术语繁多,网络搜索专业性强的需求特点,设计了一个无需输入、只根据用户上网浏览的信息特点,自动提取与发掘用户需求的导航引擎,避免因用户专业水平所限,而无法搜索到大量专业信息。详细介绍了导航引擎的核心信息挖掘模块的设计原理和启发式挖掘算法,并对设计的算法进行了测试与分析。  相似文献   

13.
文本聚类综述   总被引:1,自引:0,他引:1  
聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘、智能搜索引擎、短文本信息处理等领域获得了广泛的应用。本文首先讨论了文本聚类(Text clustering)的应用,然后对文本聚类算法、聚类关键技术进行了综述。  相似文献   

14.
首先对Web数据搜索引擎技术进行了概述,在此基础上进一步阐述数据采集过程、Robot的搜索策略、HTML解析器基本算法及数据检索模型,最后指出目前搜索引擎存在的问题,提出未来搜索引擎的发展方向。  相似文献   

15.
根据构件检索的研究现状,通过增加语义特征,改进了基于刻面分类的构件描述模型.结合领域本体,提出了基于语义的构件检索过程模型及相应的概念语义匹配算法.在基于语义的构件检索过程模型中对其中的构件推理引擎、构件分类引擎的实现进行了详细说明,并给出了贝叶斯分类方法在构件分类中的具体应用.实验表明,基于语义的构件检索方法提高了构件的查全率和查准率,证明了此方法的可行性和有效性.  相似文献   

16.
将粒子群算法的群体搜索优点和区间算法的区间分析相结合,提出了一种求解非线性方程组的区间-粒子群算法.在迭代过程中,先用粒子群算法的全局收敛性和群体搜索能力得到近似解,再用区间算法的精确搜索能力快速得到高精度的解.数值实验表明:该算法能在较大范围的初始区间内快速可靠的迭代得到高精度的解,是求解非线性方程组的一种有效的算法.  相似文献   

17.
预计参数反演是利用概率积分法预计煤矿开采后地表移动与变形的关键。总结分析了预计参数反演的最小二乘法、模式法和遗传算法,利用Matlab软件中的最优化算法工具箱,在缓倾斜煤层非充分开采条件下,对3种反演方法的计算结果进行比较。结果表明,最小二乘法计算结果准确性较好,但初始点选择不当会导致计算失败;模式法和遗传算法都无需计算函数的梯度信息,遗传算法的初值是种群,其计算结果比模式法更加准确;在各参数中,开采影响传播角θ的误差较大,通过采用遗传算法工具箱和fminbnd函数联合走向断面和倾向断面的数据进行反演,可以提高预计参数的准确性。  相似文献   

18.
Optimal strategy of searching FPD weights scanning matrix using GA-PSO   总被引:1,自引:0,他引:1  
This paper discusses a kind of optimal method used for searching flat panel display (FPD) scanning matrix. The method adopts bionic algorithm: genetic algorithm (GA) and particle swarm optimization (PSO) algorithm. The method using single GA is more time-consuming, and the search efficiency is low in later evolution; the PSO algorithm is easily falling into the local optimal solution and appears the premature convergent phenomenon. Hence, a hybrid approach of GAPSO is found to optimize the search for high grayscale weights scanning matrix. Finally in the acceptable time, it finds a weight scanning matrix (WSM) of 256 gray scales with Matlab, whose scanning efficiency reaches 94.73% and the linearity is very good.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号