首页 | 本学科首页   官方微博 | 高级检索  
 共查询到20条相似文献,搜索用时 78 毫秒
翁勍力  施水才  赵捧未 《情报杂志》2007,26(9):114-116,119
针对目前搜索引擎返回结果的海量性和无结构性,构建一个基于元搜索的聚类挖掘引擎,旨在利用元搜索引擎返回的结果,提高搜索结果聚类效率,快速有效地为用户提供一个搜索结果结构视图,从而进行进一步的知识发现。介绍了搜索引擎和挖掘引擎的主要功能及差别,应用向量空间模型对元搜索结果进行处理。介绍当前主要的聚类算法-K—means划分法和层次凝聚聚类法,并在此基础上提出基于元搜索结果将两种聚类算法相结合的聚类方法。  相似文献   

利用分类法和主题法改善搜索引擎的性能   总被引:6,自引:0,他引:6  
苏瑞竹  吴英姿 《情报科学》2001,19(11):1170-1175
本文对Internet上的检索工具搜索引擎的工作机理和性能进行了全方位的探讨,指出了常见搜索引擎信息检索缺点。同时还指出了Meta搜索引擎、智能搜索引擎和代理搜索引擎虽然提高了网络信息检索的质量,但由于分类体系不统一,类目划分标准模糊,因而仍然未能从根本上改变搜索引擎主要以关键词(自然语言)作为检索入口的现状,不能实现分类检索与主题检索的一体化。要实现搜索引擎信息检索的突破,笔者认为有必要运用情报检索语言的理论和方法来完善因特网搜索引擎的性能,实现分类、主题一体化的检索机制,克服分类检索语言单纯以学科聚类、主题语言单纯以事物聚类的局限性。  相似文献   

本文介绍了目前较为流行的搜索引擎聚类技术,对国外著名聚类搜索引擎进行了测评,并预测了搜索引擎聚类技术的未来发展。  相似文献   

为中文搜索引擎返回结果的每一条记录构建一种修改的PAT-tree结构,为整个返回结果集构建修改的整体PAT-tree结构.通过计算PAT-tree中有效节点代表短语的排序权值函数,提取基本聚类.使用与STC框架相似的聚类算法得出最后的聚类.实验表明该算法能很好地完成中文搜索引擎结果的聚类.  相似文献   

查先进  曹芬芳  郭佳 《情报科学》2019,37(12):27-33
【目的/意义】本文探索学术搜索引擎环境下的适应性学术信息搜寻,旨在推动学术搜索引擎的健康和可持 续发展。【方法/过程】首先结合认知转变和情感依恋视角构建研究模型;然后通过问卷搜集数据;再利用偏最小二 乘结构方程建模方法对数据进行分析。【结果/结论】任务非线性和主观规范正向影响适应性学术信息搜寻;学术搜 索引擎依恋正向影响适应性学术信息搜寻,同时,期望失验和主观规范对适应性学术信息搜寻的影响均受到学术 搜索引擎依恋的正向调节;适应性学术信息搜寻正向影响个人绩效。  相似文献   

介绍了个性化元搜索引擎检索结果的显示方式,包括自动聚类、主题分和网站地图等;并结合被称为下一代搜索引擎的Grokker,介绍了当前元搜索引擎的实践。  相似文献   

专题型搜索引擎调查分析   总被引:2,自引:0,他引:2  
林冉 《情报杂志》2003,22(9):18-20
通过对经济、法律、化学这三类专题型搜索引擎的调查和分析,并与google比较,从技术的角度考察和评价了专题引擎的发展现状,并提出发展建议,以期为专题引擎的发展提供参考。  相似文献   

【目的/意义】对Google、Bing、百度和搜狗四个中外文搜索引擎的自然语言问答能力进行评价,以揭示搜 索引擎正在向兼具搜索和自动问答功能的系统演进的趋势,对不同搜索引擎在不同类型问题上的自然语言回答能 力进行比较。【方法/过程】从文本检索会议和自然语言处理与中文计算会议的问答系统评测项目抽取了三类问题 (人物类、时间类、地点类),并进行搜索,以搜索引擎是否返回准确答案或包含正确答案的精选摘要为标准进行人 工评分,使用单因素方差分析和多重比较检验的方法进行比较分析。【结果/结论】主流的中外文搜索引擎均已具备 一定的自然语言问答能力,但仍存在较大的提升空间。Google总体表现最好,但对于人物类问题的回答能力弱于 搜狗。中外文搜索引擎在时间类问题上的表现均好于人物类和地点类问题。  相似文献   

在阐明文献聚类的基本概念和重要作用的基础上,介绍了当前最流行的两种文献聚类方法:层次聚类和划分聚类;论述了三种主要的文献聚类评价函数:F—measure、平均查准率、熵;指出了文献聚类函数的优缺点。  相似文献   

知识元搜索引擎:CNKI知识搜索平台   总被引:5,自引:0,他引:5  
周秀会 《现代情报》2007,27(5):220-222
介绍了CNKI知识搜索平台的功能,重点阐述了它的特色,它从技术、资源方面实现了多种资源的整合、实现了实时的知识聚类、知识元搜索、提供多样化的搜索排序和知识元链接功能,大大优于现有的各种搜索引擎和检索平台。本文对CNKI知识搜索平台的功能进行了评价,认为CNKI知识搜索平台是基于对文献内容的搜索,弥补了搜索引擎及同类检索平台的不足,能够满足用户需求,代表了电子资源检索平台的发展方向。  相似文献   

In this paper, we present a novel clustering algorithm to generate a number of candidate clusters from other web search results. The candidate clusters generate a connective relation among the clusters and the relation is semantic. Moreover, the algorithm also contains the following attractive properties: (1) it can be applied to multilingual web documents, (2) it improves the clustering performance of any search engine, (3) its unsupervised learning can automatically identify potentially relevant knowledge without using any corpus, and (4) clustering results are generated on the fly and fitted into search engines.  相似文献   

一种大规模中文搜索日志的层次聚类方法   总被引:1,自引:0,他引:1  
孙锐  金澎 《科技通报》2012,28(8):83-85
提出一种层次聚类算法,旨在对搜索引擎的查询日志数据进行聚类分析。算法基于搜狗实验室公开的查询日志数据,通过3次划分完成查询文本聚类,每一次划分实现不同程度的降维。相似度参数可根据不同的聚类需求调整,算法可扩展性强。实验结果为查询推荐、相关性排序等提供了有力的依据。  相似文献   

中文智能搜索引擎现状探析   总被引:9,自引:0,他引:9  
闫翔  陈远 《情报科学》2002,20(12):1326-1328
随着Internet的发展,传统的搜索引擎暴露出越来越多的弊病,导致智能搜索引擎的出现。而中文的特性也必然使中文智能搜索引擎具有其独特的一面。本文就传统搜索引擎的缺陷与中文智能搜索引擎现状与功能作了一些探析。  相似文献   

传统搜索引擎与语义搜索引擎服务比较研究   总被引:2,自引:0,他引:2  
通过对传统搜索引擎和语义搜索引擎的服务进行科学的比较,将两种搜索引擎的服务按照服务对象、服务内容、服务策略、服务模式等进行了认真的分析,从中揭示出传统搜索引擎和语义搜索引擎在用户服务方面的不同特征。对未来搜索引擎的发展和用户服务的研究提供了较好的参考。  相似文献   

赵金海  赵西安 《现代情报》2008,28(1):218-220,223
从优秀搜索引擎、搜索引擎网站、搜索引擎论坛、搜索引擎新闻和搜索引擎会议等方面入手,对国外现有论述搜索引擎的主要资源、种类、性能和特色进行了述评.在此基础上,推荐有关搜索引擎的最佳资源,为人们学习掌握搜索引擎的资源、搜索技巧、方法和优化检索策略提供参考资料和学习途径.  相似文献   

We present PubSearch, a hybrid heuristic scheme for re-ranking academic papers retrieved from standard digital libraries such as the ACM Portal. The scheme is based on the hierarchical combination of a custom implementation of the term frequency heuristic, a time-depreciated citation score and a graph-theoretic computed score that relates the paper’s index terms with each other. We designed and developed a meta-search engine that submits user queries to standard digital repositories of academic publications and re-ranks the repository results using the hierarchical heuristic scheme. We evaluate our proposed re-ranking scheme via user feedback against the results of ACM Portal on a total of 58 different user queries specified from 15 different users. The results show that our proposed scheme significantly outperforms ACM Portal in terms of retrieval precision as measured by most common metrics in Information Retrieval including Normalized Discounted Cumulative Gain (NDCG), Expected Reciprocal Rank (ERR) as well as a newly introduced lexicographic rule (LEX) of ranking search results. In particular, PubSearch outperforms ACM Portal by more than 77% in terms of ERR, by more than 11% in terms of NDCG, and by more than 907.5% in terms of LEX. We also re-rank the top-10 results of a subset of the original 58 user queries produced by Google Scholar, Microsoft Academic Search, and ArnetMiner; the results show that PubSearch compares very well against these search engines as well. The proposed scheme can be easily plugged in any existing search engine for retrieval of academic publications.  相似文献   

赵金海 《现代情报》2007,27(3):62-64
从桌面搜索工具、搜索引擎指南、目录和论著资源等方面入手,对国外现有论述搜索引擎的主要资源的种类、性能和特色进行了述评。在此基础上,推荐有关搜索引擎的最佳资源,为人们学习掌握搜索引擎的资源、搜索技巧、方法和优化检索策略提供参考资料和学习途径。  相似文献   

搜索引擎检索结果的网页组织技术及其优化策略   总被引:2,自引:0,他引:2  
张海涛  高松 《情报科学》2006,24(6):900-903
本文分析了搜索引擎检索结果的组织技术及其存在的不足,并对检索结果的组织技术进行了优化处理,最后分析了搜索引擎检索结果中提高网页排名的优化策略。  相似文献   

刘俊熙 《现代情报》2010,30(3):7-10,13
在实际的信息搜索中,许多问题是传统关键词搜索不能有效解决的。在此背景下,能将隐性知识转化成显性知识的知识搜索应运而生,为用户提供最简单便捷获取有效信息的途径和方式,成为搜索引擎的补充和延伸,并有可能成为下一代搜索引擎技术(信息检索向知识搜索转化)发展的方向。由知识搜索的变异而生成的、引发众多争议的人肉搜索更使知识搜索成为搜索领域的热门话题。本文主要对两者的性质概念及相互关系予以阐述。  相似文献   

Recent research in the human computer interaction and information retrieval areas has revealed that search response latency exhibits a clear impact on the user behavior in web search. Such impact is reflected both in users’ subjective perception of the usability of a search engine and in their interaction with the search engine in terms of the number of search results they engage with. However, a similar impact analysis has been missing so far in the context of sponsored search. Since the predominant business model for commercial search engines is advertising via sponsored search results (i.e., search advertisements), understanding how response latency influences the user interaction with the advertisements displayed on the search engine result pages is crucial to increase the revenue of a commercial search engine. To this end, we conduct a large-scale analysis using query logs obtained from a commercial web search. We analyze the short-term and long-term impact of search response latency on the querying and clicking behaviors of users using desktop and mobile devices to access the search engine, as well as the corresponding impact on the revenue of the search engine. This analysis demonstrates the importance of serving sponsored search results with low latency and provides insight into the ad serving policy of commercial search engines to ensure long-term user engagement and search revenue.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号