首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
一种新的搜索引擎探讨   总被引:1,自引:0,他引:1  
罗三定  廖程锋 《情报学报》2004,23(4):428-432
传统的搜索引擎都不具备理解文档内容的能力 ,导致查准率普遍不高。本文提出一种采用RDF和信息提取技术的新的搜索引擎。该引擎采用信息提取技术自动获取和生成网络资源的元数据 ,由RDF描述并携带在互联网上传输、交换 ,智能代理负责收集、处理该元数据信息并向用户提供检索服务。由于计算机可以理解RDF携带的元数据的含义 ,因此可以做到基于内容的概念检索。本文在分析各种技术背景的基础上 ,给出了这种搜索模型的结构图 ,阐述了该系统的原理、优点 ,并给出了部分模块的设计  相似文献   

2.
基于搜索引擎分类信息的用户查询歧义消减   总被引:1,自引:1,他引:0  
用户在利用搜索引擎进行信息检索时,查询条件往往存在歧义,这导致搜索结果的多样性和冗余性.传统的方法主要是基于语义分析或构建知识库,此类方法在实际应用中的可行性不高.本文基于搜索引擎的分类信息,实现了一个简单有效的分类搜索系统.它首先根据用户的查询条件,将返回的搜索结果进行分类,并以树形目录的形式展示给用户,而后根据用户的点击数据,逐步确定用户的搜索意图,从而达到了查询歧义消减的目的.论文详细介绍了系统的设计思想、架构和工作流程.测试实例表明,该系统可以在一定程度上确定用户的查询意图,为用户返回更加准确的搜索结果.  相似文献   

3.
对于搜索引擎返回的结果太多且较少考虑用户个性差异等缺陷,提出根据用户查询意图,实时给予多个主题的搜索建议,帮助用户更准确地描述所需信息,修正查询词与真实意图之间的差距,提高检索效率。同时运用K-means算法,对资源类别的意图特征值相似用户进行聚类,缩小查找目标对象最近邻居的范围,提高搜索建议的实时响应速度。实验结果表明,该方法是可行的。  相似文献   

4.
基于XML的智能元搜索引擎研究   总被引:1,自引:0,他引:1  
介绍一种基于XML和Agent技术的智能元搜索引擎系统。该系统采用元搜索引擎的结构,以Agent作为架构系统的基本组件,利用Agent的自治性和协作性来完成用户个性化信息的搜索;利用XML和XSL分别在结构化信息表达方面,在信息显示、转换方面的优点,来实现元搜索引擎的扩展性以及搜索结果的个性化输出。最后探讨XML和XSL在查询请求和搜索结果转换上的应用以及基于XML的Agent通信。  相似文献   

5.
搜索引擎中Robot搜索算法的优化   总被引:15,自引:0,他引:15  
目前的搜索引擎越来越暴露出不足之处 ,当用户使用搜索引擎时输入特定关键词之后 ,返回的查询结果往往有数千甚至几百万之多 ,而且其中包含大量的重复信息与垃圾信息 ,用户从中筛选出自己感兴趣的网页仍然需要耗费很长的时间。另外一种情况就是 ,Web上明明存在某些重要网页 ,却没有被搜索引擎的robot发现。本文针对这种现象 ,重点讨论搜索引擎中的搜索策略 ,改善搜索算法 ,使Robot在搜索阶段就能够充分处理与Robot频繁交互的URL列表。根据网页的内容、HTML结构以及其中包含的超链信息计算网页的PageRank ,使URL列表能够根据重要性调整排列顺序。初步的试验结果表明 ,本文的优化算法可以较大程度地改进搜索引擎的整体性能  相似文献   

6.
传统搜索引擎通常靠抓取全文关键词进行分析,由此带来三大缺陷:缺乏语义描述导致查准率低;检索结果冗余模糊导致检索效率低;检索途径不足。基于DC元数据描述网络资源的优越性,课题组设计了一个基于DC元数据的网络搜索引擎系统DCSE,力图克服传统搜索引擎的上述缺陷。DCSE系统自动抓取含DC描述的Web网页,把DC描述信息存入到数据库,排序索引后提供用户检索。检索界面设计成以15个DC元素为检索项的多项逻辑组合检索,检索结果以各DC元素的描述内容来显示,如标题、创建者、描述、日期等。用户通过多项组合检索提高查准率,并通过清晰的结果显示对所需信息做出快速判断、选择,从而达到提高检索效率的目的。  相似文献   

7.
大数据时代,智能终端技术和搜索引擎技术的发展,为改进数字图书馆读者的搜索体验提供了可能。通过分析读者的个性化搜索需求,文章提出了一种大数据时代基于读者体验视角的数字图书馆个性化搜索引擎。该搜索引擎可节省搜索时间和提高查询效率,使查询成本最小,显著提高了系统的整体搜索性能。  相似文献   

8.
面向跨领域海量信息资源的元搜索引擎研究   总被引:1,自引:0,他引:1  
跨领域海量信息资源搜索是从事交叉学科和跨学科研究的重要前提.元搜索引擎不仅可以避免独立搜索引擎覆盖面较低的局限性,而且还可以充分发挥不同独立搜索引擎之间的互补性.基于元搜索引擎的跨领域海量信息资源搜索需要解决四个关键问题,即协助用户准确表达搜索意图、消除检索词的"一词多义"和"多词一义"现象、设计自动调整检索范围的机制以及发挥用户价值.面向跨领域海量信息资源的元搜索引擎采用多领域本体、语义web和web2.O技术,较好地解决了元搜索引擎的上述四个关键问题.相对于传统元搜索引擎,面向跨领域海量信息资源的元搜索引擎在基本思路、框架设计、流程设计、关键技术四个方面发生了重要变化.  相似文献   

9.
查国伟  杨春兰 《传媒》2006,(1):42-44
现时代网络搜索已经成为人们获得信息的一种便捷的途径,而伴随着互联网搜索业务的繁荣,以手机为载体的无线搜索业务也在悄然兴起,和Google等基于电脑和互联网平台的传统搜索引擎相比,无线搜索的优势在于用户可以直接获得简明扼要的查询结果,而不是大量的网页链接.  相似文献   

10.
王若佳  李培 《图书情报工作》2015,59(11):111-118
[目的/意义] 针对当前我国网络用户的健康信息检索行为, 探索利用中文搜索引擎的健康信息检索规律, 为完善健康搜索引擎和网站建设提供参考。[方法/过程] 基于搜狗搜索引擎的大规模查询日志, 采用日志挖掘的方法, 从查询行为和点击行为两个角度对网络用户的健康信息检索行为进行研究。查询行为的研究指标包括会话层(会话长度、用户重复查询), 查询串层(查询串长度、重复查询)和词项层(高频词汇, 主题分类);点击行为的研究指标为点击位置和点击内容。[结果/结论] 健康相关查询的重复率较高, 提示相关网站可缓存高重复率查询串的返回结果;大众关注的热点领域为疾病、保健、母婴、医疗机构与美容整形, 提示网站的导航设计注意导航方向;用户更偏爱使用问答型平台, 提示网站设计者应更加关注与用户间问答型的互动模式。  相似文献   

11.
简论搜索引擎及其应用技巧   总被引:1,自引:0,他引:1  
王玲 《图书馆论坛》2005,25(2):115-118
随着Internet发展和信息量的日益剧增,搜索引擎的出现为人们快速、准确地查询自己所需要的信息提供了有效的检索工具。文章在概述搜索引擎及其运行方式和分类的基础上,讨论与分析了搜索引擎技术的应用技巧、常见问题及解决方法。  相似文献   

12.
秦拴狮 《情报学报》2005,24(5):540-547
本文解析了因特网信息的查全与查准问题,讨论了搜索引擎的局限性并对因特网的信息查询提出若干建议。  相似文献   

13.
基于神经网络的中文信息概念联想构造算法   总被引:6,自引:0,他引:6  
刁倩  王永成  张惠惠 《情报学报》2000,19(2):170-175
本文提出了用Kohonen自组织映射神经网络进行中文信息的概念联想。概念联想有利于中文信息的查询与自动分类 ,并可将其用于当前Internet上的搜索引擎。同时提供了相关实验与测试结果。  相似文献   

14.
田明君  杨晓江 《情报学报》2008,27(2):250-255
SRW是一种基于Web Service的网络联机检索协议,它为我们通过Web提供信息检索服务,提供了类似于Z39.50的检索能力,从而提供了基于Web的书目资源整合方法.实现一个SRW服务虽然比实现一个Z39.50服务要相对简单,但其中会涉及一些新的概念、标准和技术问题,例如,SOAP通信架构,CQL检索语法,Dublin Core元数据标准等.本文描述了一个SRW服务系统的设计思想及具体实现.对涉及的关键技术,如SRW的三个主要操作的执行、SOAP消息的内容及封装、CQL语法的解析、MARC数据与Dublin Core元数据的转换等进行了详细的介绍.  相似文献   

15.
OBJECTIVES: HealthCyberMap (HCM-http://healthcybermap.semanticweb.org) is a web-based service for healthcare professionals and librarians, patients and the public in general that aims at mapping parts of the health information resources in cyberspace in novel ways to improve their retrieval and navigation. METHODS AND SERVICE DESCRIPTION: HCM adopts a clinical metadata framework built upon a clinical coding ontology for the semantic indexing, classification and browsing of Internet health information resources. A resource metadata base holds information about selected resources. HCM then uses GIS (Geographic Information Systems) spatialization methods to generate interactive navigational cybermaps from the metadata base. These visual cybermaps are based on familiar medical metaphors. CONCLUSIONS: HCM cybermaps can be considered as semantically spatialized, ontology-based browsing views of the underlying resource metadata base. Using a clinical coding scheme as a metric for spatialization ('semantic distance') is unique to HCM and is very much suited for the semantic categorization and navigation of Internet health information resources. Clinical codes ensure reliable and unambiguous topical indexing of these resources. HCM also introduces a useful form of cyberspatial analysis for the detection of topical coverage gaps in the resource metadata base using choropleth (shaded) maps of human body systems.  相似文献   

16.
There is a current trend to make museum collections widely accessible by digitising cultural heritage collections for the Internet. The present study takes a user perspective and explores the characteristics of online museum visitors' web search behaviour. A combination of quantitative and qualitative methods was deployed in a case study at a National Museum of Military History. Quantitatively, data from a web questionnaire survey and a user study of interactive searching behaviour were collected and analysed. Qualitatively, observation protocols were coded and analysed based on inductive content analysis. It was found that metadata elements on factual object related information, provenience, and historic context was indicated to be relevant by the majority of the respondents, characterising the group of special interest museum visitors as information hungry. Further, four main characteristics of online museum visitors' searching behaviour were identified: (a) searching behaviour has a strong visual aspect, (b) topical searching is predominantly exploratory, (c) users apply broad known item searches, and (d) meaning making is central to the search process.  相似文献   

17.
A traditional library catalog does not do justice to maps and aerial photographs. Text can never fully describe them and maps' and aerial photographs' geographic coverage or perimeters cannot be displayed visually in the online public access catalog (OPAC), so searching based on their textual metadata without specific spatial reference data used also for display purposes is often not enough to locate relevant items. The Hebrew University of Jerusalem's (HUJI) Geography Department has developed a spatial search engine for their scanned aerial photographs collection that allows users to locate one or more aerial photographs according to the area of the Earth's surface that was photographed and their accompanying metadata. The Humanities and Social Sciences Library, which holds a large unscanned print map collection, has asked to integrate a similar map search mechanism in the Department's existing search engine, and a new website was launched in December 2015 (http://ccg.huji.ac.il/aerialphotos/) showing the aerial photographs' center points alongside the maps' rectangle perimeter. The search engine retrieves maps and aerial photographs that intersect with a user-drawn rectangle. This article discusses the characteristics of these collections, the rationale behind searching for maps and aerial photographs together, and the process of defining and building this spatial search engine. This method allows users to view which items are available in their area of interest side-by-side, on a Google Maps background map.  相似文献   

18.
ABSTRACT

This study analyzed the search results of four main Internet search engines on three newly created digital collections at Texas Tech University Libraries, in order to assess the search engine indexing on metadata and PDF files of digital items that are published in the institutional repository. The exploratory study found that only one search engine discovered PDF files, while the others only discovered metadata. The results of the study also suggested that metadata and PDF files can supplement each other to facilitate discoverability of the digital collections on search engines, and revealed some findings that are contradictory to conclusions in previous research.  相似文献   

19.
基于EDC的书目元信息管理系统设计与实现   总被引:2,自引:0,他引:2  
DublinCore(简称DC)是Internet上一种适用于普通电子文档元数据的规范 ,而文献信息领域的元数据规范为MARC标准。为了实现大量的MARC书目数据在Internet上的重用 ,本文对DC进行了扩展 ,在此基础上设计并实现了一个基于EDC(ExtendedDublinCore)的书目元信息管理系统 ,讨论了其中的关键技术 ,系统的成功运行证明了设计方案的可行性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号