排序方式: 共有63条查询结果,搜索用时 31 毫秒
11.
在分析传统期刊影响力评价指标缺陷的基础上,引入一种新的期刊影响力评价指标———基于PageRank算法的期刊影响力权值。首先详细阐述其思想、计算过程和影响因素等,然后以国外图书情报类期刊为例,计算图书情报领域期刊的影响力权值,分析这些期刊的学术影响力,并将其与期刊影响因子、期刊自引率、总被引次数等指标进行对比分析。 相似文献
12.
讨论了Spam的基本概念和影响,详细分析了当前各种Spamming技术,包括Term Spaming、Link Spamming和隐藏技术三种类型,这对于开发恰当的反击措施是非常有用的。 相似文献
13.
SEO SPAM和飞速发展的网页规模要求更优的网页排名技术,在研究链接分析技术PageRank及互信息模型后,提出了检索相关度算法(IR-REL),构建相关词链表计算网页的布尔权重。该排名同时将权威度和相关度作为影响因子,可提高检索相关度,降低关键词作弊影响。文章给出了具体的排名策略、实验数据和系统模型。 相似文献
14.
15.
Spam页面可能极大地恶化诸如PageRank的基于排序的搜索算法。如何识别并抑制Spam页面已经成为一个很重要的问题。本文针对这个问题详细的分析了各种侦测和移除Spam页面的算法或方法,主要包括通用的方法、反面的方法和其它针对具体情形的方法三种类型。最后,文章对识别spam页面的关键技术及其前景进行了分析、展望。 相似文献
16.
[目的/意义]核心专利的发现是技术创新的重要环节,对于技术改进和专利战略布局意义重大。[方法/过程]首先界定核心专利的概念,然后在对原始PageRank算法模型介绍的基础上,结合专利的被引次数和专利的年龄对原始的PageRank算法进行改进,提出PatentRank算法(简称PTR),并将其应用到OLED领域中来识别核心专利。[结果/结论]研究发现,相比被引次数,PTR不仅能将该领域的核心专利识别出来,而且还可以识别出一些重要性的基础性专利,为研究OLED相关技术提供追本溯源的研究思路;相比原始PageRank算法,PTR具有更高的值区分度,在局部改善了PR的排名。 相似文献
17.
基于阅读价值的科技文献排序方法研究 总被引:1,自引:1,他引:0
科技文献的准备是开展科研工作的必须步骤和重要基础,而当前从电子期刊数据库中检索到的相关文献往往成百上千篇.如何判断一篇文献的阅读价值,并快速准确地获得相关知识,成为科技文献服务方面的一个共性需求.本文针对在科研工作中需要快速对文献按阅读价值进行排序并获得相关知识这一共性需求,以PageRank算法为基础,提出并验证了一种综合考虑文献的内容、期刊、作者、时间等反映文献阅读价值的因素对文献进行排序的PaperRank方法.该方法在得到依据文献阅读价值的排序结果的同时,还可获得在某一问题或领域研究中的重要作者和重要文献等相关知识. 相似文献
18.
On-line topical importance estimation: an effective focused crawling algorithm combining link and content analysis 总被引:2,自引:0,他引:2
Can Wang Zi-yu Guan Chun Chen Jia-jun Bu Jun-feng Wang Huai-zhong Lin 《浙江大学学报(A卷英文版)》2009,10(8):1114-1124
Focused crawling is an important technique for topical resource discovery on the Web. The key issue in focused crawling is to prioritize uncrawled uniform resource locators (URLs) in the frontier to focus the crawling on relevant pages. Traditional focused crawlers mainly rely on content analysis. Link-based techniques are not effectively exploited despite their usefulness. In this paper, we propose a new frontier prioritizing algorithm, namely the on-line topical importance estimation (OTIE) algorithm. OTIE combines link- and content-based analysis to evaluate the priority of an uncrawled URL in the frontier. We performed real crawling experiments over 30 topics selected from the Open Directory Project (ODP) and compared harvest rate and target recall of the four crawling algorithms: breadth-first, link-context-prediction, on-line page importance computation (OPIC) and our OTIE. Experimental results showed that OTIE significantly outperforms the other three algorithms on the average target recall while maintaining an acceptable harvest rate. Moreover, OTIE is much faster than the traditional focused crawling algorithm. 相似文献
19.
古籍数字画廊的实践与探讨 总被引:2,自引:0,他引:2
通过对“中国科学院图书馆特藏文献”数字画廊的内容、特点、风格及制作设备和技术的介绍,探讨在人员、设备、资金不足的情况下,如何逐步实现古籍文献的数字化。 相似文献
20.