首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
超级搜索     
星辰 《百科知识》2009,(15):23-23
众所周知,搜索引擎已经成为上网必不可少的工具。随着人们对信息搜索的要求不断提高,搜索引擎也在不断地进步。最近,美国科学家史蒂芬·沃尔弗拉姆就发明了一个新的搜索引擎——“沃尔弗拉姆·阿尔法”(Wolfram Alpha)。据国外媒体报道,沃尔弗拉姆在其博客中介绍称,该搜索引擎由100多名技术人员秘密研究了几年时间而完成。  相似文献   

2.
搜索引擎检索技术及其优化策略   总被引:1,自引:0,他引:1  
何毅 《现代情报》2008,28(5):171-173
本文介绍了搜索引擎的基本工作原理,分析了搜索引擎检索技术及其衡量搜索引擎的标准--查全率和查准率,最后分析了搜索引擎检索结果中提高网页排名的优化策略.  相似文献   

3.
分析了搜索引擎原理及分类,阐述了垂直搜索引擎原理及功能模块设计,以提高垂直搜索引擎对特定领域信息检索的深度和完整度。  相似文献   

4.
山寨搜索引擎的使用方法和Google、百度一样,都是通过输入关键词来搜索要查询的内容。不同的是山寨搜索引擎利用独立搜索引擎的结果,然后把所得的搜索结果显示出来。山寨搜索引擎采用了成员搜索引擎选择技术、搜索请求转换技术、搜索结果输出技术和有效信息提取技术。山寨搜索引擎具有搭建环境简易、方便搜索、搜索结果丰富和个性化的搜索特点。同时,山寨版搜索引擎也存在着搜索时间长、返回结果不满意、只支持简单高级搜索的缺点。鉴于此,本文就山寨搜索引擎的发展现状、技术特点等进行了初步探讨,在此基础上,进一步对基于山寨搜索引擎的发展趋向进行了展望。  相似文献   

5.
张玉珍 《现代情报》2003,23(11):89-90,94
本文对网络搜索引擎的工作过程、类别及中文搜索引擎的现状作了简要分析,指出中文搜索引擎目前存在的具体问题。论述了可以提高中文搜索引擎质量的几种途径,同时对中文搜索引擎今后的发展趋势作了阐释。  相似文献   

6.
搜索引擎为网络用户检索海量信息提供了便利,本文从扩大检索范围、提高查全率以及缩小检索范围、提高查准率着手进行了搜索引擎检索策略的调整研究。  相似文献   

7.
赵金海 《现代情报》2007,27(10):49-51
从应用的角度,探讨了适用于搜索引擎.尤其大型压缩文本数据库的(s.c)-压缩编码压缩技术。应用于搜索引擎,可直接搜索压缩文件.并把搜索速度提高到搜索非压缩文件的8倍。在搜索引擎工作时,实现了需求与小文件的合理压缩比.有效提高了网络环境下搜索引擎的搜索速度。  相似文献   

8.
为提高通用搜索引擎对医学学科及主题的覆盖率,在开源搜索框架Nutch平台上,通过构建医学词典,结合中文分词插件,构建了一个面向医学信息的垂直搜索引擎,并详细介绍了改进后的系统功能和体系结构。相对于通用搜索引擎,该改进提高了医学信息判别的准确度和效率,减少了搜索结果冗余,同时提高了系统对于互联网复杂环境的处理能力。  相似文献   

9.
专题搜索引擎也称垂直搜索引擎,主要用来满足特定领域的用户需求。Heritrix是开源的网络爬虫,Heritrix的WebUI启动方式并不易用于广大用户。本文改变了往常对Heritrix用法,摒弃了Heritrix的WebUI启动方式,对Heritrix源码进行修改,将Lucene整合到Heritrix中,构建成一个完整的搜索引擎,并通过监听器监听搜索引擎状态,使搜索引擎能够进行自动爬取和数据更新。同时,本文添加了网页过滤模块以及对查询结果排序算法进行了改进,提高了搜索引擎的易用性和查询的准确率。  相似文献   

10.
简要介绍元搜索引擎的基本原理及其在危机信息监测中的应用,然后构建基于元搜索引擎的危机信息监测系统(CIMS_ME)体系结构框架,重点阐述CIMS_ME系统实现过程中的搜索引擎调度策略、文档选择策略、时间提取方法等五大重要技术问题,为实现该系统提供了理论和技术支持。  相似文献   

11.
Real time search is an increasingly important area of information seeking on the Web. In this research, we analyze 1,005,296 user interactions with a real time search engine over a 190 day period. Using query log analysis, we investigate searching behavior, categorize search topics, and measure the economic value of this real time search stream. We examine aggregate usage of the search engine, including number of users, queries, and terms. We then classify queries into subject categories using the Google Directory topical hierarchy. We next estimate the economic value of the real time search traffic using the Google AdWords keyword advertising platform. Results shows that 30% of the queries were unique (used only once in the entire dataset), which is low compared to traditional Web searching. Also, 60% of the search traffic comes from the search engine’s application program interface, indicating that real time search is heavily leveraged by other applications. There are many repeated queries over time via these application program interfaces, perhaps indicating both long term interest in a topic and the polling nature of real time queries. Concerning search topics, the most used terms dealt with technology, entertainment, and politics, reflecting both the temporal nature of the queries and, perhaps, an early adopter user-based. However, 36% of the queries indicate some geographical affinity, pointing to a location-based aspect to real time search. In terms of economic value, we calculate this real time search stream to be worth approximately US $33,000,000 (US $33 M) on the online advertising market at the time of the study. We discuss the implications for search engines and content providers as real time content increasingly enters the main stream as an information source.  相似文献   

12.
[目的/意义]文章旨在探究诸如任务等影响游客社会化搜寻的因素,为旅游机构利用社交服务网站开展营销活动,成功激发游客的出游行为提供决策参考。[方法/过程]本研究基于实验法,考察任务不确定性(确定性任务vs.不确定性任务)、感知可用信息缺失(高vs.低)和时间距离(长vs.短)对游客社会化搜寻动机的影响。[结果/结论]结果显示:1)相对于确定性任务,不确定性任务下,游客的社会化搜寻动机大;2)相对于感知可用信息缺失程度低,感知可用信息缺失程度高下游客的社会化搜寻动机大;3)相对于时间距离长,时间距离短下游客的社会化搜寻动机大;4)时间距离能调节任务不确定性与游客社会化搜寻动机之间的关系,感知时间距离短,任务不确定性对游客社会化搜寻动机无影响;感知时间距离长时,不确定任务下社会化搜寻动机强,确定性任务下社会化搜寻动机弱。  相似文献   

13.
14.
Over time, researchers have acknowledged the importance of understanding the users’ strategies in the design of search systems. However, when involving users in the comparison of search systems, methodological challenges still exist as researchers are pondering on how to handle the variability that human participants bring to the comparisons. This paper present methods for controlling the complexity of user-centered evaluations of search user interfaces through within-subjects designs, balanced task sets, time limitations, pre-formulated queries, cached result pages, and through limiting the users’ access to result documents. Additionally, we will present our experiences in using three measures – search speed, qualified search speed, and immediate accuracy – to facilitate the comparison of different search systems over studies.  相似文献   

15.
段凡丁 《情报科学》1992,13(5):27-30
本文介绍了一种高效率的计算机检索算法。此算法的检索时间复杂性与数据量的大小无关,完全独立于数据量的大小,可有效地解决数据量越大检索速度越低的矛盾,对于大容量信息系统中的数据检索和情报检索是非常有效的。  相似文献   

16.
陈慧 《现代情报》2010,30(4):62-65
本文论述了搜索引擎的概念、基本原理、主要功能及作用,并针对国内比较著名的搜索引擎站点进行了详尽的分析,在此基础上,对中文网络搜索引擎发展的现状进行了分析,在看到中文搜索引擎发展的同时,也要看到中文搜索引擎在发展中存在的问题。  相似文献   

17.
奉小斌 《科研管理》2017,38(10):22-30
虽然许多研究发现新创企业知识搜索提升产品创新绩效,但却忽视了企业相对竞争对手的搜索时机选择对其产品创新绩效的影响。文章分析了集群新创企业领先搜索和跟随搜索对产品创新绩效的影响以及管理者联系的调节作用,并以215个集群新创企业样本进行实证检验。研究结果表明:领先搜索与跟随搜索对产品创新绩效有倒U型影响;集群外部联系增强领先搜索与产品创新绩效的曲线关系;集群内部联系削弱领先搜索与产品创新绩效的曲线关系,但正向调节跟随搜索对产品创新绩效的曲线影响。这一发现丰富了平行搜索和产品创新绩效关系研究,实践上对新创企业实施创新搜索与提升产品创新绩效有指导意义。  相似文献   

18.
基于内容的非结构化P2P搜索系统中直接影响查询效果和搜索成本的两个主要问题是,高维语义空间所引起的文本相似度计算复杂以及广播算法带来的大量冗余消息. 本文提出利用集合差异度实现基于内容聚类的P2P搜索模型提高查询效率和减少冗余消息。该模型利用集合差异度定义文本相似度,将文本相似性的计算复杂度控制在线性时间内而有效地减少了查询时间;利用节点之间的集合差异度实现基于内容的聚类,既降低了查询时间,又减少了冗余消息.模拟实验表明,利用集合差异度构建的基于内容的搜索模型不仅具有较高的召回率,而且将搜索成本和查询时间分别降低到了Gnutella系统的40%和30%左右.  相似文献   

19.
在脉冲超宽带(IR-UWB)系统中,脉冲时位同步对接收机的信号检测,保证通信的有效性和可靠性方面具有重要的作用.文献[1]提出了五种基于Markov链模型的顺序搜索算法,给出了平均捕获时间公式.文献[2]从集合论的数学分析方法论证了串行搜索中存在一种最优排列,同时得出此最优排列即为跳K搜索.本文对IR-UWB密集多径信道产生其接收脉冲信号的簇特性进行描述分析,同时采用蒙特卡罗仿真方法对文献[1]给出的五种搜索算法的平均搜索捕获步数进行了性能仿真,分析仿真结果得出在未知信道参数时比特反转搜索算法所需的平均捕获时间性能最好.  相似文献   

20.
The purpose of this study is to provide automatic new topic identification of search engine query logs, and estimate the effect of statistical characteristics of search engine queries on new topic identification. By applying multiple linear regression and multi-factor ANOVA on a sample data log from the Excite search engine, we demonstrated that the statistical characteristics of Web search queries, such as time interval, search pattern and position of a query in a user session, are effective on shifting to a new topic. Multiple linear regression is also a successful tool for estimating topic shifts and continuations. The findings of this study provide statistical proof for the relationship between the non-semantic characteristics of Web search queries and the occurrence of topic shifts and continuations.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号