首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 312 毫秒
1.
先从网页内容和网页链接的角度计算网页与主题的相似度,然后将二者归一化,最终确定网页与主题的相关度.从分析网页内容相似度的角度保证网页与主题的相关性,从网页链接分析的角度解决网页搜索的权威性和覆盖乔率.算法还对PageRank算法进行了改进,将访问网页的概率加入到算法计算过程中,实验结果表明,新的算法具有较高的搜索效率.  相似文献   

2.
杨泳丹 《科技通报》2019,35(7):178-181,185
针对PageRank算法存在的不足,本文对网络链接的结构进行分析,并以此为基础对PageRank的算法进行了改进,提出了主题链接相似度的PageRank算法。本文算法的核心是将当前网页与入链网页的主题相关度作为传递权值,替换PageRank算法中以平均值作为权值。本文的PageRank-I算法将网页之间的链接作为链接的向量,以这种链接的关系来对向量的余弦相似度进行主题相关性的描述,而不用对额外的文本信息进行处理,减少了系统负担。实验结果证实本文的PageRank-I算法在没有增加系统的额外负担的同时,也没有增加时间上的复杂度,解决了PageRank算法中主题漂移的问题。  相似文献   

3.
分析了基于链接结构的PageRank算法,考虑算法在网页排序方面的客观优点的同时,指出了其在判定网页主题相关性方面的不足,提出了基于主题预测相关度加权的改进策略,为提高定向信息采集的准确率和召回率提供了理论依据.  相似文献   

4.
基于机器学习的Web链接的抽取   总被引:1,自引:0,他引:1  
互联网网页是通过超链接连接起来的,为人们的日常生活和商务用途提供了非常丰富的信息资源。链接结构分析在万维网的很多研究领域发挥着越来越重要的作用。然而存在着许多与主题无关的链接,造成了主题漂移。本文分析了链接本身的特点,介绍了一种有监督机器学习方法自动地抽取网页中的相关链接。试验结果表明该算法具有实用的价值。  相似文献   

5.
通过将研究分解成三个子任务,对网络数据从运用PageRank与TrustRank剔除作弊网页开始;借助结合网页间主题相关度、时间差以及在线评论比例的权重的TC-PageRank算法,提炼与产品主题高度相关并包含大量在线评论数据的网页集;最后考虑了网页与产品主题的相似度以及网页的链接增幅对网页权威性的影响,运用改进的HITS算法,确定在线评论分析数据来源的权威网页集;而基于MapReduce的矩阵分块运算,降低了算法时空的复杂度。并通过仿真实验验证了该方法的可行性与准确性。  相似文献   

6.
针对传统的基于Web图的垂直搜索策略Authorities and Hubs,提出了一种融合了网页内容评价和Web图的启发式垂直搜索策略,此外,引入向量空间模型进行针对网页内容的主题相关度判断,进一步提高主题网页下载的准确率.实验表明,文中算法有效地提高了主题网页的聚合程度,且随着网页下载数量的增加,垂直搜索引擎的准确率逐渐递增,并在下载网页达到一定数量后,准确率趋于稳定,算法具有较好的鲁棒性,可以应用到相关垂直搜索引擎系统中.  相似文献   

7.
使用AllTheWeb对四大门户网站的网页总数、链接总数、外部链接数进行测度,并计算出其网络影响因子和链接效率,以此来评价四大门户网站的被利用情况.将5种链接指标与网站的人均页面访问量进行相关性分析,初步确定外部链接数能同时提升网站影响力和流量,为门户网站自身优化提供了思路.  相似文献   

8.
研究主要针对PageRank只考虑链接关系,而不考虑相关性的缺点进行了一些改进,把Web数据挖掘技术的内容挖掘应用到PageRank算法中,基于超链接文本和内容与主题的相关性,提出了PageRank算法的优化算法,并通过实验仿真,实验结果表明改进后的方法对提高更高相关性的网页的排名是有效的,符合人们的期望。  相似文献   

9.
张晓琴  路永和 《现代情报》2008,28(2):221-225
本文分析了用户在网页浏览过程中点击超链接的影响因素,其中使用了Schamber和Bateman建立的相关性评价标准工具对用户进行实验.实验主要是通过网络发放调查问卷的形式进行.通过用户对这些相关性评价标准的重要性评分,结果发现"主题相关"和"描述准确"是参与者主要使用的相关性评价标准.  相似文献   

10.
评述了Web中链接的分布机制--优先连接与均匀连接.大型链接网络中,可用二者结合的混合机制对链接分布现象进行解释.整体而言,链接分布呈幂律分布,可用优先连接机制进行解释,但对于特定的网页集合,需用均匀连接机制进行解释.链接网络中,存在人为操纵的链接现象,如"交换链接"、"购买链接"等,两种机制均无法解释.引文网络与链接网络相似,本文提出可将链接分布机制移植到引文分布的研究中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号