首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
林文清 《情报杂志》2007,26(9):120-121
垂直搜索引擎在获取信息方面有着综合搜索引擎无法比拟的优势,在B2B领域中垂直搜索引擎开始成为搜索引擎发展的一个新趋势。研究了B2B垂直搜索引擎在信息获取技术中与其他搜索引擎的区别,探索了垂直搜索引擎在信息获取技术中应用的价值,并对B2B垂直搜索引擎在信息技术中的应用进行了展望。  相似文献   

2.
垂直搜索引擎系统的设计与实现   总被引:1,自引:0,他引:1  
面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。  相似文献   

3.
当今信息时代,互联网信息逐渐增多,中国网民人数随之增多,人们获取信息的方式中搜索引擎成为主要数据搜索的工具。面对浩瀚的信息资源,网民使用通用搜索引擎搜索时,返回的结果量十分庞大,使得想要找到自己需要的信息有时十分困难,针对某一领域的垂直搜索引擎能够解决这个问题。本文结合垂直搜索引擎的结构等特征,研究中文分词方法,比较分析目前较为流行的一些分词方法。  相似文献   

4.
为提高通用搜索引擎对医学学科及主题的覆盖率,在开源搜索框架Nutch平台上,通过构建医学词典,结合中文分词插件,构建了一个面向医学信息的垂直搜索引擎,并详细介绍了改进后的系统功能和体系结构。相对于通用搜索引擎,该改进提高了医学信息判别的准确度和效率,减少了搜索结果冗余,同时提高了系统对于互联网复杂环境的处理能力。  相似文献   

5.
垂直搜索引擎系统的研究与实现   总被引:2,自引:1,他引:1  
给出了垂直搜索引擎的体系结构,然后分别设计了垂直搜索引擎的三大核心模块:主题词库、网络机器人和中文分词。在主题词库模块中设计了一个分层的主题词库系统,该词库将颗粒大的主题词置于词库高层,而将颗粒小的主题词置于词库低层,既考虑了主题搜索的广度,也考虑了主题搜索的精度。而在网络机器人设计过程中则综合运用了多线程及基于VSM的主题相关度判断算法进行主题网页爬行,在中文分词设计中则采用最大正向匹配算法完成中文分词。实验表明,多线程是提高网络机器人爬行速度的关键。此外,搜索引擎的准确率达到了63%。  相似文献   

6.
林立  刘思得 《情报探索》1997,(4):28-28,30
中文网络搜索引擎是获取中文网页信息的有力工具,本文简要介绍中文搜索引擎悠游的特点,组成,信息资源以及检索方法。  相似文献   

7.
陶荣  陈燕 《大众科技》2010,(2):19-21
随着因特网的迅猛发展,搜索引擎提供导航服务己经成为互联网上非常重要的网络服务。利用Lucene开源全文本搜索技术框架建立全文检索系统,设计实现了索引器、检索器、中文分析器等模块,完成了一个基于Lucene的搜索引擎的应用,改进后的基于Lucene的全文检索系统能更好地支持中文及更准确地提供给用户所需要的信息。  相似文献   

8.
钟辉新 《情报杂志》2008,27(1):118-120
针对具体行业运用领域的需求,采用机器学习的方法对Web内容进行分析和挖掘并提供个性化服务是搜索引擎的一个重要发展趋势.从搜索引擎的通过原理出发,针对通用搜索引擎存在问题,构建基于垂直搜索引擎的个性化信息体系结构,结合用户共同兴趣模型与Hopfield Net Spider搜索策略实现用户个性化信息服务.  相似文献   

9.
中文电子期刊的元搜索引擎   总被引:3,自引:0,他引:3  
楼松斋  张惠惠 《情报科学》2003,21(11):1195-1197
本文首先介绍了元搜索引擎的特点和实现原理,并结合中文电子期刊的发展和应用现状,提出了应用中文期刊元搜索引擎的发展需要;最后建立了一个中文期刊元搜索引擎的设计模块,并对其系统结构和相关技术进行了论述。  相似文献   

10.
网络信息的急剧膨胀使得通用搜索引擎暴露出诸多问题.如何让用户方便、快捷地找到自己需要的"深层次"信息,成为一个亟待解决的问题.针对上迷问题,在分析垂直搜索的特点及关键技术的基础上,提出了一种改进的基于VSM的垂直搜索检索模型及其性能评测方法,并给出了基于Agent垂直搜索引擎的系统架构及系统各部分的功能描述.  相似文献   

11.
主要介绍了主题搜索引擎、网络爬虫的基本概念和Heritrix系统的体系结构,分析了Heritrix的工作流程,在Heritrix框架的基础上进行扩展和优化。通过一个实例,实现了对京东网图书信息的抓取,为建立面向图书信息的垂直搜索引擎提供了网页信息资源。  相似文献   

12.
本文通过垂直搜索引擎的关键算法研究,论述垂直搜索引擎设计与实现时的一些独特的信息识别方法,包括Pagerank和HITS算法。  相似文献   

13.
国内医学搜索引擎的现状及发展对策   总被引:1,自引:0,他引:1  
朱晓丽 《现代情报》2007,27(2):32-34,38
通用搜索引擎没有对医学专业信息进行优化处理,不适合检索专业化的医学信息。因此,为了适应用户需要,加强对医学专业搜索引擎的研究是十分必要的。本文指出了国内医学搜索引擎存在的问题,提出了中文医学搜索引擎改变现状、快速发展的几点对策。  相似文献   

14.
综合搜索引擎与垂直搜索引擎的比较研究   总被引:17,自引:0,他引:17  
刘畅 《情报科学》2007,25(1):97-102
搜索引擎是目前互联网信息服务的主要工具,它的竞争也日趋激烈,搜索引擎的信息服务也逐渐引起重视。本文从信息服务的角度出发,通过对综合搜索引擎与垂直搜索引擎在信息服务各个要素方面的比较,找出它们之间的竞争与合作的关系,为当前的搜索引擎发展做出初步的分析。  相似文献   

15.
论提高中文搜索引擎质量的途径   总被引:11,自引:0,他引:11  
焦微玲 《情报科学》2002,20(1):100-102
随着网络信息数量的迅猛增长,搜索引擎的网络导航作用日益增强,然而搜索引擎自身也存在“信息过载”、“信息超量”的现象,如何克服上述现象,向用户提供数量适宜、质量优良的信息是目前迫切需要解决的问题。本文立足于本文搜索引擎,在分析了我国搜索引擎的发展状况和存在的问题之后,简单论述了可以提高中文搜索引擎质量的几条途径。  相似文献   

16.
殷丽 《现代情报》2004,24(9):38-41
通过对目前几大中文综合性搜索引擎网络信息分类体系的现状和存在的问题进行分析,提出了对构建中文综合性搜索引擎分类体系的建议与设想。认为,试图强行“统一”不是万全之策,惟有吸收RDF和XML的思想,构建出一个规则框架,强化其可扩展性。  相似文献   

17.
搜索引擎是人们使用Internet信息资源的重要工具.本文对当代的中文搜索引擎进行了简要的分析,指出了其局限性和发展的趋势.  相似文献   

18.
垂直搜索是针对某一个行业的专业搜索引擎;Lucene是Java编写的全文索引引擎工具包,可以跨平台使用;Heritri。是一个功能强大的开源Web网络爬虫。本文主要探讨Lucene和Heritrix在构建垂直搜索引擎中的应用。  相似文献   

19.
自然语言检索中的中文分词技术研究进展及应用   总被引:1,自引:0,他引:1  
何莘  王琬芜 《情报科学》2008,26(5):787-791
中文分词技术是实现自然语言检索的重要基础,是信息检索领域研究的关键课题,无论是专业信息检索系统还是搜索引擎都依赖于分词技术的研究成果。本文通过在国内外著名数据库中进行相关检索,分析了研究中文分词技术及其在著名搜索引擎中的应用。  相似文献   

20.
刘俊熙  盛宇 《现代情报》2009,29(3):143-145
垂直搜索被普遍认为将是下个潜力市场,是搜索引擎的细分和延伸。是对某类网页资源和结构化资源的深度整合。本文综合分析了垂直搜索的特性,并从信息采集、信息索引和信息处理方面分析其同通用搜索引擎的差异,然后通过垂直搜索在电子政务上的强势进入的案例来分析其应用发站的特性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号