首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
基于概念的权重PageRank改进算法   总被引:2,自引:0,他引:2  
杨彬  康慕宁 《情报杂志》2006,25(11):70-72
对比了基于链接分析的搜索引擎排序算法PageRank和HITS。针对原有PageRank算法采用的平分页面自身PageRank值的策略,提出了一种按权值分配的改进算法。权值由页面间的概念关联比重和用户的搜索概念确定。  相似文献   

2.
孟瑞玲 《现代情报》2010,30(7):93-96
智能搜索引擎的提出引发了新一轮搜索引擎革命,然而其实现还有一定的困难。以目前非常成熟的PageRank技术为基础进行改进,构建基于个人需要的PageRank算法,可以实现智能搜索引擎所需要的多种个性化功能。目前在大型广域搜索引擎上建立个性化的智能搜索引擎还比较困难,而高校图书馆在信息规模、用户基础和运行条件上都有建立智能搜索引擎的优势。对目前的高校图书馆检索系统进行一定的改进,可以实现智能搜索引擎的个性化功能。  相似文献   

3.
解决用户的模糊查询问题一直以来是信息检索领域研究的热点。为了解决不同用户间的查询差异,一种称为个性化搜索的技术得以提出,其通过获取用户的喜好来识别查询意图,但研究发现很少有用户愿意直接或间接提供个人信息。本文提出一种基于用户点击历史信息自动获取用户兴趣进而对搜索结果进行个性化呈现的Web搜索系统架构。基于主题相关PageRank技术,设计了用户兴趣学习算法和个性化搜索页面排序算法。实验表明该算法能有效学习用户的兴趣信息,提高了个性化Web搜索质量。  相似文献   

4.
提出了一种改进用户浏览行为的用户兴趣模型,该模型综合考虑了用户对页面的浏览行为、用户的长期兴趣和短期兴趣。将这种改进的用户兴趣模型应用于个性化搜索引擎系统中,详述了系统的基本框架、系统基本功能模块,开发了一个演示系统IUBPSES。模拟实验显示:利用该改进用户兴趣模型的搜索引擎系统进行关键词搜索,其搜索效果优于'-3前主流搜索引擎系统。最后,指出了需要改进和进一步研究方向。  相似文献   

5.
个性化搜索引擎是一种用户驱动网页排名结果的优化方式。基于本体和语义网,用户建模可以作出准确的查询结果,它包括:限定搜索方式、过滤搜索结果,以及成为搜索过程等3种方式。因此,个性化搜索引擎用户模型可被视为用户驱动个性化搜索服务的模型。研究结论是整合前人研究并且提出"用户行为(用户兴趣、用户偏好、用户查询记录)-用户文档(用户行为与关键词组)-用户建模(相关性算法与排名算法)-个性化服务"的新模型,可作为数字图书馆发展个性化搜索引擎的指引。  相似文献   

6.
Google的PageRank技术剖析   总被引:39,自引:5,他引:39  
曹军 《情报杂志》2002,21(10):15-18
检索结果排序算法一直是情报检索系统的核心技术之一,在搜索引擎中的地位则更加重要。通过对搜索引警google的关键技术PageRank的深入剖析,分析了其在Google排序系统中的作用,并对其发展所存在的问题进行了探讨。  相似文献   

7.
搜索引擎将网络信息进行有效的组织,从而使庞杂的网络信息变得有序化,通过搜索引擎能够快速准确地获取所需信息。搜索引擎通过采用网页评级的方式,按照级别由大到小地将检索结果展现给用户。显然,级别高的网页必定会被优先浏览。因此,对于网络建设者来说,提高网页级别是十分重要的。文章从PageRank算法着手,对影响网站排名的因素如:网站内部的链接模式、外部链接和外向链接进行计算分析,最终得出有效的链接模式。  相似文献   

8.
[目的/意义]从建构主义视角出发,综述国外“搜索即学习”领域中“将信息搜索视为学习过程”的研究成果,为今后探索用户网络信息搜索中的知识变化主题提供理论基础和方法论支持。[方法/过程]围绕用户网络信息搜索中用户领域知识结构的变化、用户系统知识结构的变化、用户知识变化的搜索实验任务设计、面向用户学习的信息检索系统优化设计4个分主题进行分析和总结。[结果/结论]第一,意义建构理论和建构主义学习理论可以有效地揭示用户信息搜索过程中的学习机制。第二,用户网络信息搜索中的学习同时包括领域知识学习和系统知识学习两部分,但是已有的研究却缺乏对这两个组成部分交互机制的探索。第三,已有的研究设计了面向用户学习的检索算法,并优化或开发了相应的搜索系统。  相似文献   

9.
从信息过滤系统模型功能及其实现出发,探讨了Google中PageRank技术环境下的用户偏好的分析描述与表达.在传统的过滤算法的基础上进行了改进后的过滤算法的模型构建和原形研究,结合实践进行了实验结果分析.  相似文献   

10.
网络信息的急剧膨胀使得通用搜索引擎暴露出诸多问题.如何让用户方便、快捷地找到自己需要的"深层次"信息,成为一个亟待解决的问题.针对上迷问题,在分析垂直搜索的特点及关键技术的基础上,提出了一种改进的基于VSM的垂直搜索检索模型及其性能评测方法,并给出了基于Agent垂直搜索引擎的系统架构及系统各部分的功能描述.  相似文献   

11.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。  相似文献   

12.
李江华  时鹏 《情报杂志》2012,31(4):112-116
Internet已成为全球最丰富的数据源,数据类型繁杂且动态变化,如何从中快速准确地检索出用户所需要的信息是一个亟待解决的问题.传统的搜索引擎基于语法的方式进行搜索,缺乏语义信息,难以准确地表达用户的查询需求和被检索对象的文档语义,致使查准率和查全率较低且搜索范围有限.本文对现有的语义检索方法进行了研究,分析了其中存在的问题,在此基础上提出了一种基于领域的语义搜索引擎模型,结合语义Web技术,使用领域本体元数据模型对用户的查询进行语义化规范,依据领域本体模式抽取文档中的知识并RDF化,准确地表达了用户的查询语义和作为被查询对象的文档语义,可以大大提高检索的准确性和检索效率,详细地给出了模型的体系结构、基本功能和工作原理.  相似文献   

13.
随着互联网的不断发展,搜索引擎现在已成为网络用户获取信息的一个不可或缺的检索工具.搜索引擎目前存在诸多问题,例如查全率和查准率、功能问题、作弊问题、安全性问题、信息更新问题、规范化问题等.本文就这些问题进行一些探讨.  相似文献   

14.
网络技术推动了传统信息服务业的发展,搜索引擎技术在信息服务业中有着越来越广泛的应用。本文首先对各行各业搜索引擎技术应用于信息服务业的现状进行了抽样调查,列出了部分有代表性的用户的应用实际情况;然后总结出了不同领域对搜索引擎的要求,和应用中存在的问题。进而通过对需求和存在问题的分析引出了个性化搜索引擎的概念,提出信息服务业与个性化搜索引擎相结合的道路,探索了搜索引擎技术应用于信息服务业的未来发展方向。  相似文献   

15.
Search engine optimization allows for users’ needs to be directly met by result snippets or a “knowledge map” without clicking any results. This behavior is called “good abandonment” and is found to frequently occur during mobile searching. Users exhibit such a behavior when they trust the result that addresses their information need without bothering to click it. Therefore, this study examines how users judge a result's credibility without clicking. This study proposes a model for assessing the credibility of good abandonment results, making a hypothesis about the measures that may affect credibility assessments in mobile searches. A credibility assessment experiment was conducted to collect users’ eye movements, perceived credibility and feedback on different credibility measures. Users’ search behaviors were recorded by a screen recorder, in order to see whether a search was good abandonment. Then the initially proposed model was validated in terms of users’ perceived credibility, search behaviors and feedback, and further improved. The revised model found that the credibility assessment of good abandonment results in mobile searching is determined by six credibility measures distributed across three aspects of content, operator and design. Content-related measures show that users tend to believe the results if there is detailed and updated context information and the content is neutral. Operator-related measures indicate the impact of trust in the search engine on the credibility assessment. Design-related measures indicate that users tend to trust results with interactive functions and optimal layouts. How each of the six measures influence users’ assessment of credibility is discussed in this paper.  相似文献   

16.
随着网络的飞速发展,网页数量急剧膨胀,近几年来更是以指数级进行增长,搜索引擎面临的挑战越来越严峻,很难从海量的网页中准确快捷地找到符合用户需求的网页。网页分类是解决这个问题的有效手段之一,基于网页主题分类和基于网页体裁分类是网页分类的两大主流,二者有效地提高了搜索引擎的检索效率。网页体裁分类是指按照网页的表现形式及其用途对网页进行分类。介绍了网页体裁的定义,网页体裁分类研究常用的分类特征,并且介绍了几种常用特征筛选方法、分类模型以及分类器的评估方法,为研究者提供了对网页体裁分类的概要性了解。  相似文献   

17.
基于Web的图像搜索引擎   总被引:1,自引:0,他引:1  
蔡颖 《情报科学》2002,20(10):1075-1077
随着互联网的快速普及,宽带网的全力推行,网络上的图像信息急剧膨胀,多媒体文件越来越多,与此同时,用户对网上图像搜索的要求也在不断增长,在这种背景下,传统的文本搜索方式已经不能满足用的特殊需要,如何能更方便快捷地从网络上找到需要的图像或多媒体文件?于是,各种基于Web的图像搜索引擎应运而生。它们各自以不同的工作方式,使我们对网上图像信息的搜索变得非常简单,本文将从图像搜索引擎的工作原理,搜索方法以及国内外各大图像搜索引擎三个方面作一介绍。  相似文献   

18.
秦明  周泓 《科技广场》2012,(2):21-24
从上世纪90年代至今,是互联网高速发展的时期。目前,中国互联网用户总量为2.98亿人,已成为全球互联网用户最多的国家。随之而来的是对搜索服务需求的增加,截至2008年底,中国搜索引擎用户规模已达到2.03亿人。根据艾瑞咨询(iResearch)发布的报告,2008年中国搜索引擎市场规模已达到50.3亿元。百度与谷歌作为中国搜索引擎行业的领导者,两者之间的竞争将影响这一庞大规模市场的市场结构、市场绩效以及消费者的福利,所以对两者之间竞争的分析思考是具有现实意义的。  相似文献   

19.
RSS: A framework enabling ranked search on the semantic web   总被引:1,自引:0,他引:1  
The semantic web not only contains resources but also includes the heterogeneous relationships among them, which is sharply distinguished from the current web. As the growth of the semantic web, specialized search techniques are of significance. In this paper, we present RSS—a framework for enabling ranked semantic search on the semantic web. In this framework, the heterogeneity of relationships is fully exploited to determine the global importance of resources. In addition, the search results can be greatly expanded with entities most semantically related to the query, thus able to provide users with properly ordered semantic search results by combining global ranking values and the relevance between the resources and the query. The proposed semantic search model which supports inference is very different from traditional keyword-based search methods. Moreover, RSS also distinguishes from many current methods of accessing the semantic web data in that it applies novel ranking strategies to prevent returning search results in disorder. The experimental results show that the framework is feasible and can produce better ordering of semantic search results than directly applying the standard PageRank algorithm on the semantic web.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号