首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 203 毫秒
1.
宁琳 《现代情报》2014,34(1):155-158
跨语言检索是一种重要的信息检索手段之一。为了提高跨语言检索效率,采用语义扩展的方法,通过分析其设计思想和工作流程,构建出一种基于语义扩展的跨语言自动检索模型,重点对其语义扩展、知识库和结果聚类等设计进行了阐述,提出了语义理解切分法的分词方法,采用了Single-Pass算法进行聚类,实验结果表明,该模型能有效提高跨语言检索的查全率和查准率。  相似文献   

2.
从检索方法、结果展现和评估方法三方面分析跨语言信息检索的现状,引出翻译检索一体化的跨语言信息检索方法,把翻译、检索结合在同一检索模型中.一体化将翻译和检索中的不确定性组合在一起,从而做出更全局的优化,减少跨语言信息检索与单语检索之间的差距,从而充分利用单语检索中的有用方法;并针对万方数据现有资源,构建出面向科技文献的跨语言信息检索系统框架.  相似文献   

3.
网上信息跨语言检索方法   总被引:5,自引:1,他引:5  
刘卫中 《情报科学》2004,22(12):1503-1504
本文介绍了目前全世界网络语言的现状和实现网上信息跨语言检索的五种方法,阐述了跨语言检索对实现网络信息资源共享的重要性。  相似文献   

4.
曲琳琳 《情报科学》2021,39(8):132-138
【目的/意义】跨语言信息检索研究的目的即在消除因语言的差异而导致信息查询的困难,提高从大量纷繁 复杂的查找特定信息的效率。同时提供一种更加方便的途径使得用户能够使用自己熟悉的语言检索另外一种语 言文档。【方法/过程】本文通过对国内外跨语言信息检索的研究现状分析,介绍了目前几种查询翻译的方法,包括: 直接查询翻译、文献翻译、中间语言翻译以及查询—文献翻译方法,对其效果进行比较,然后阐述了跨语言检索关 键技术,对使用基于双语词典、语料库、机器翻译技术等产生的歧义性提出了解决方法及评价。【结果/结论】使用自 然语言处理技术、共现技术、相关反馈技术、扩展技术、双向翻译技术以及基于本体信息检索技术确保知识词典的 覆盖度和歧义性处理,通过对跨语言检索实验分析证明采用知识词典、语料库和搜索引擎组合能够提高查询效 率。【创新/局限】本文为了解决跨语言信息检索使用词典、语料库中词语缺乏的现象,提出通过搜索引擎从网页获 取信息资源来充实语料库中语句对不足的问题。文章主要针对中英文信息检索问题进行了探讨,解决方法还需要 进一步研究,如中文切词困难以及字典覆盖率低等严重影响检索的效率。  相似文献   

5.
文章从跨语言检索的概念、类型、理论、实现方法以及关键技术这几个方面简要对跨语言信息检索技术的发展进行总结与展望。  相似文献   

6.
本文分析了跨语言信息检索的现状,介绍和描述跨语言信息检索的主要问题,并针对万方数据和NSTL的现有资源,构建出基于科技文献的跨语言信息检索原型系统,此原型系统通过字典查询得到检索词翻译,应用Google在线翻译进行标题、摘要翻译,并预留中国科学院自动化所提供的翻译引擎扩展.跨语言信息检索强调检索结果翻译的可读性,帮助用户理解基本大意,不刻意追求准确性,力求在应用过程中促进机器翻译技术的进步和发展,辅助科研.  相似文献   

7.
[目的/意义]旨在为跨语言文本聚类研究提供参考。[方法/过程]首先,通过分句及计算每个句子的语义特征值确定文档的特征句集并进行文档向量表示;其次,将词旋转距离(Word Rotator’s Distance,WRD)的思路引入相似度计算步骤中,提出语义特征句向量距离(Semantic Feature Sentence Vectors’ Distance, SFSVD)相似度计算方法,获得不同文档间的相似度;最后,利用HAC聚类算法获得文本聚类的结果。[结果/结论]提出的汉语-俄语跨语言文本聚类方法对比现有方法,其Purity值和NMI值显著提升且表现稳定。基于语义特征句和SFSVD相似度计算方法能够较准确地表示文本信息,从而进一步提升汉语-俄语跨语言文本聚类的性能。  相似文献   

8.
在对跨库检索技术基本原理和实现方法分析的基础上,以天津商业大学为例,研究跨库检索技术在高校图书馆教学参考系统中的应用与实现.本系统选择PHP,MySQL和Apache作为开发工具,跨库检索采用基于互联网的联合检索方法.在对目标数据库检索参数进行分析的基础上,采用CURL访问组件来实现代理检索程序.  相似文献   

9.
武夷山 《现代情报》2010,30(9):39-39
2010年6月11日,在芬兰首都赫尔辛基举行的ICSTI(国际科技信息理事会)夏季会议上,举行了“世界科学跨语言检索平台”发布仪式。在以下链接可以看到较详细的发布内容http:∥federatedsearchblog.com/2010/06/13/deep-web-technologies-unveils-multilingual-federated-search/。我代表中国科学技术信息研究所在此发布仪式上做了简短发言。“世界科学跨语言检索平台”的网站是,http:∥worldwidescience.org/multilingual,在这里可以进行跨语言跨库检索。该平台的最大价值是,帮助大家  相似文献   

10.
胡滨  吴雯娜 《情报科学》2012,(9):1291-1297
知识组织系统互操作一直是图书情报界研究的热点,是实现跨库、跨域浏览与检索的关键技术之一。基于对近年来国内外43个知识组织系统互操作项目的系统调研,总结知识组织系统的3种互操作模式和8种互操作方法,认为国内知识组织系统互操作研究应注重跨语言的互操作、中外文分类法兼容及分类语言和主题语言的互操作,以及跨词表和跨领域知识组织系统的互操作。  相似文献   

11.
We study several machine learning algorithms for cross-language patent retrieval and classification. In comparison with most of other studies involving machine learning for cross-language information retrieval, which basically used learning techniques for monolingual sub-tasks, our learning algorithms exploit the bilingual training documents and learn a semantic representation from them. We study Japanese–English cross-language patent retrieval using Kernel Canonical Correlation Analysis (KCCA), a method of correlating linear relationships between two variables in kernel defined feature spaces. The results are quite encouraging and are significantly better than those obtained by other state of the art methods. We also investigate learning algorithms for cross-language document classification. The learning algorithm are based on KCCA and Support Vector Machines (SVM). In particular, we study two ways of combining the KCCA and SVM and found that one particular combination called SVM_2k achieved better results than other learning algorithms for either bilingual or monolingual test documents.  相似文献   

12.
基于本体的跨语言信息检索在数字图书馆中的应用   总被引:2,自引:0,他引:2  
鲍丽倩  张自然 《现代情报》2011,31(7):169-172
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系统,并详细阐述了系统的流程,着重讲述了数字图书馆跨语言领域本体的构建。由于本体具有良好的概念层次和对逻辑推理的支持,对源语言和目标语言进行语义扩展,提高了数字图书馆跨语言系统的检索效率。  相似文献   

13.
目前大多数机器翻译和跨语言检索系统都是基于通用语料,对外文科技资料的翻译效果不理想,本文结合科技文献的加工方法,研究面向科技文献的跨语言信息检索系统的模型。首先对跨语言信息检索的概念和特点进行简单的概述,从3个角度介绍跨语言信息检索的研究方法,然后讨论构建跨语言信息检索系统的必要性,在此基础上设计出一个面向科技文献的跨语言信息检索系统模型以及主要功能结构。  相似文献   

14.
This paper presents a laboratory based evaluation study of cross-language information retrieval technologies, utilizing partially parallel test collections, NTCIR-2 (used together with NTCIR-1), where Japanese–English parallel document collections, parallel topic sets and their relevance judgments are available. These enable us to observe and compare monolingual retrieval processes in two languages as well as retrieval across languages. Our experiments focused on (1) the Rosetta stone question (whether a partially parallel collection helps in cross-language information access or not?) and (2) two aspects of retrieval difficulties namely “collection discrepancy” and “query discrepancy”. Japanese and English monolingual retrieval systems are combined by dictionary based query translation modules so that a symmetrical bilingual evaluation environment is implemented.  相似文献   

15.
This article describes a framework for cross-language information retrieval that efficiently leverages statistical estimation of translation probabilities. The framework provides a unified perspective into which some earlier work on techniques for cross-language information retrieval based on translation probabilities can be cast. Modeling synonymy and filtering translation probabilities using bidirectional evidence are shown to yield a balance between retrieval effectiveness and query-time (or indexing-time) efficiency that seems well suited large-scale applications. Evaluations with six test collections show consistent improvements over strong baselines.  相似文献   

16.
张雪梅  过仕明 《现代情报》2013,33(7):112-117
以CNKI数字出版平台所收录的文献为依据,对近年来我国跨语言信息检索(CLIR:Cross Language Information Retrieval)的文献进行文献计量学统计,选取2001-2012年间研究成果作为数据样本,并从文献年代分布、文献被引情况、文献情报源分布、研究人员及机构分布、获得资助情况、关键词及论文主题分布进行统计分析,对2001-2012年关于跨语言信息检索的研究现状进行了梳理和总结,从而为进一步的研究和发展提供参考。  相似文献   

17.
This paper explores the integration of textual and visual information for cross-language image retrieval. An approach which automatically transforms textual queries into visual representations is proposed. First, we mine the relationships between text and images and employ the mined relationships to construct visual queries from textual ones. Then, the retrieval results of textual and visual queries are combined. To evaluate the proposed approach, we conduct English monolingual and Chinese–English cross-language retrieval experiments. The selection of suitable textual query terms to construct visual queries is the major issue. Experimental results show that the proposed approach improves retrieval performance, and use of nouns is appropriate to generate visual queries.  相似文献   

18.
Through the recent NTCIR workshops, patent retrieval casts many challenging issues to information retrieval community. Unlike newspaper articles, patent documents are very long and well structured. These characteristics raise the necessity to reassess existing retrieval techniques that have been mainly developed for structure-less and short documents such as newspapers. This study investigates cluster-based retrieval in the context of invalidity search task of patent retrieval. Cluster-based retrieval assumes that clusters would provide additional evidence to match user’s information need. Thus far, cluster-based retrieval approaches have relied on automatically-created clusters. Fortunately, all patents have manually-assigned cluster information, international patent classification codes. International patent classification is a standard taxonomy for classifying patents, and has currently about 69,000 nodes which are organized into a five-level hierarchical system. Thus, patent documents could provide the best test bed to develop and evaluate cluster-based retrieval techniques. Experiments using the NTCIR-4 patent collection showed that the cluster-based language model could be helpful to improving the cluster-less baseline language model.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号