首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
语言模型是目前信息检索研究的热点,本文对Ponte和Croft在该领域的先驱性工作做了一系列修正及简化改进,并在此基础上对基于语言模型的信息检索的两大框架做了综合比较分析,在从理论上揭示了模型的实质的同时,通过一系列实验验证了简化改进以及平滑方法的效果.  相似文献   

2.
跨语言信息检索可视化研究   总被引:5,自引:0,他引:5  
张会平  周宁  陈立孚 《情报科学》2007,25(1):134-138
语言的多样性限制了人们利用信息的自由,也影响了信息价值的充分发挥。因此,跨语言信息检索成为当今的研究热点。本文将信息可视化的相关方法和技术应用到跨语言信息检索领域当中,提出了跨语言信息检索可视化模型,并介绍了一个实例——澳门法律信息可视化系统。  相似文献   

3.
以ChatGPT为代表的大语言模型带来了人工智能技术的新一轮发展浪潮,获得了广泛的社会关注。大语言模型通过大规模无标注数据预训练、指令微调、人类对齐等关键技术途径,学习到了丰富的世界知识,具有较好的文本理解与生成能力,能够有效求解各种复杂任务。这一重要技术进展对于信息检索领域的发展带来了新的机遇。本文从大语言模型对于已有信息检索架构的改进以及现有检索技术如何改进大语言模型两个方面进行阐述,针对相关科学问题的可行技术方法进行了梳理与展望,探讨大语言模型时代下的信息检索发展趋势,旨在推动信息检索领域的科研进步。  相似文献   

4.
语言模型是实现自然语言处理的关键所在,在分析人类语音理解过程的基础上,介绍了统计语言模型,讨论总结了统计语言模型目前所面临的问题,为进一步提高统计语言模型能力提供了思路。  相似文献   

5.
吴丹  齐和庆 《现代情报》2009,29(7):215-221
信息检索发展中的一个重要理论问题是如何对查询与文档进行匹配,由此形成了不同的信息检索模型。跨语言信息检索是信息检索研究的一个分支,也是近年来的热点问题。本文主要对信息检索模型的研究进展,及其在跨语言信息检索中的应用进展进行分析与综述。  相似文献   

6.
基于本体的跨语言信息检索在数字图书馆中的应用   总被引:2,自引:0,他引:2  
鲍丽倩  张自然 《现代情报》2011,31(7):169-172
首先对跨语言信息检索和相关技术进行了介绍,了解当前跨语言信息检索技术的不足,然后阐述了传统跨语言信息检索技术在数字图书馆应用中的局限性,并由此引出了基于本体的跨语言技术。最后提出了一种基于本体的数字图书馆跨语言信息检索系统,并详细阐述了系统的流程,着重讲述了数字图书馆跨语言领域本体的构建。由于本体具有良好的概念层次和对逻辑推理的支持,对源语言和目标语言进行语义扩展,提高了数字图书馆跨语言系统的检索效率。  相似文献   

7.
跨语言信息检索模型应用研究   总被引:1,自引:0,他引:1  
刘伟成  孙吉红 《情报杂志》2007,26(10):55-57
信息检索过程自始至终都涉及相关性问题和检索模型,跨语言信息检索(CLIR)也不例外。对检索模型进行了分类,论述了各模型在CLIR中的应用,并对各模型进行了比较。  相似文献   

8.
随着信息化的迅速发展,智能技术的普及,实现计算机对自然语言和文字处理的需求日益增大,语言处理系统得到迅速发展。目前计算机语言学经验主义的研究办法得出对于自然语言的处理系统其核心是统计语言模型。顾名思义,统计语言模型是借助数学统计的方法对自然语言的内在规律进行描述的数学模型。本文介绍了统计语言模型的定义和分类,以及模型的数学原理。  相似文献   

9.
目前大多数机器翻译和跨语言检索系统都是基于通用语料,对外文科技资料的翻译效果不理想,本文结合科技文献的加工方法,研究面向科技文献的跨语言信息检索系统的模型。首先对跨语言信息检索的概念和特点进行简单的概述,从3个角度介绍跨语言信息检索的研究方法,然后讨论构建跨语言信息检索系统的必要性,在此基础上设计出一个面向科技文献的跨语言信息检索系统模型以及主要功能结构。  相似文献   

10.
大型语言模型是当今人工智能领域最前沿的研究方向之一,该方向旨在训练含有大规模参数的通用语言模型,使其能够遵循人类指令完成不同类型的自然语言处理任务。作为大型语言模型的代表,由OpenAI研发的ChatGPT在各个领域均展现出强大的自然语言生成能力,受到了全球各行各业的关注。本文从语言模型的发展历程出发,介绍了近年研究者在扩大语言模型规模上的探索,然后分析了大型语言模型带来的范式改变,并以ChatGPT为典型实例概述了其发展、技术和应用,接着介绍了后ChatGPT时代大型语言模型的前沿进展,最后从评价和治理两方面总结了目前大型语言模型的局限性及未来需要解决的挑战。  相似文献   

11.
This paper presents a relevance model to rank the facts of a data warehouse that are described in a set of documents retrieved with an information retrieval (IR) query. The model is based in language modeling and relevance modeling techniques. We estimate the relevance of the facts by the probability of finding their dimensions values and the query keywords in the documents that are relevant to the query. The model is the core of the so-called contextualized warehouse, which is a new kind of decision support system that combines structured data sources and document collections. The paper evaluates the relevance model with the Wall Street Journal (WSJ) TREC test subcollection and a self-constructed fact database.  相似文献   

12.
申华明 《科教文汇》2020,(4):179-180
巴黎新索邦大学的Jean-Claude Beacco教授于2007年出版的《语言教育中的能力教学法》(L'approche par compétences dans l'enseignement des langues)是一本专门探讨能力教学法的著作。本书立足《欧洲语言共同参考框架:学习、教学、评估》,对“交际能力”“策略”等核心概念进行重新审视,构建以话语体裁为核心的能力教学模式,为外语教学提供了新视角。本文简要介绍各章主要内容,以期为我国语言教育的发展提供借鉴。  相似文献   

13.
Language modeling (LM), providing a principled mechanism to associate quantitative scores to sequences of words or tokens, has long been an interesting yet challenging problem in the field of speech and language processing. The n-gram model is still the predominant method, while a number of disparate LM methods, exploring either lexical co-occurrence or topic cues, have been developed to complement the n-gram model with some success. In this paper, we explore a novel language modeling framework built on top of the notion of relevance for speech recognition, where the relationship between a search history and the word being predicted is discovered through different granularities of semantic context for relevance modeling. Empirical experiments on a large vocabulary continuous speech recognition (LVCSR) task seem to demonstrate that the various language models deduced from our framework are very comparable to existing language models both in terms of perplexity and recognition error rate reductions.  相似文献   

14.
Language modeling is an effective and theoretically attractive probabilistic framework for text information retrieval. The basic idea of this approach is to estimate a language model of a given document (or document set), and then do retrieval or classification based on this model. A common language modeling approach assumes the data D is generated from a mixture of several language models. The core problem is to find the maximum likelihood estimation of one language model mixture, given the fixed mixture weights and the other language model mixture. The EM algorithm is usually used to find the solution.  相似文献   

15.
The estimation of query model is an important task in language modeling (LM) approaches to information retrieval (IR). The ideal estimation is expected to be not only effective in terms of high mean retrieval performance over all queries, but also stable in terms of low variance of retrieval performance across different queries. In practice, however, improving effectiveness can sacrifice stability, and vice versa. In this paper, we propose to study this tradeoff from a new perspective, i.e., the bias–variance tradeoff, which is a fundamental theory in statistics. We formulate the notion of bias–variance regarding retrieval performance and estimation quality of query models. We then investigate several estimated query models, by analyzing when and why the bias–variance tradeoff will occur, and how the bias and variance can be reduced simultaneously. A series of experiments on four TREC collections have been conducted to systematically evaluate our bias–variance analysis. Our approach and results will potentially form an analysis framework and a novel evaluation strategy for query language modeling.  相似文献   

16.
为了探索汉语自然语言处理的系统方法,基于自动机理论、用形式语言方法对汉语进行了建模、并作了实验设计。着重于词法说明,给出了系统方法的补充描述。该系统方法将中间语言的各部分内容以一种新的组合方式呈现为一个整体。  相似文献   

17.
刘杰 《科教文汇》2011,(26):110-111
总结二语语法教学的历史,我们可以发现,二语语法教学的必要性及价值经过多年的讨论,已经在研究者和广大教师中达成了共识。但在二语语法教学方法方面,多年的讨论至今并没有产生一个让每一位研究者和二语教师都信服且经过实证研究证明了的有效方法。本文尝试对形式与意义并重、明示与暗示同行的二语语法教学模式进行探讨,以期给二语教学工作者提供又一个角度。  相似文献   

18.
本文主要讨论了Krashen的习得理论,尤其是输入假说及其对我国外语课堂教学的启示,旨在探讨在吸收、借鉴国外语言理论的同时,如何做到为我所用,从而不断探索出适合我国外语学习者的好方法。  相似文献   

19.
语言与文化紧密相连,语言习得的过程亦无法脱离文化习得。传统语言文化教学二元论已无法满足目前的大学英语教学需要,这也对大学英语教学提出了新的挑战。本文在回顾我国大学英语教学传统模式的基础上,以语言文化教学融合观为理论依据,探讨大学英语教学中将语言教学与文化教学合二为一的融合模式。  相似文献   

20.
彭云鹏 《科教文汇》2013,(16):118-119
语言定型是一种具有固定映射意义的语言单位,是对事物和现象范畴化、概念化并进而语言化的结果,是该民族语言个性的身份标记在语言中的体现,体现为一些固定套式或刻板公式。作为一种语言现象,语言定型具有语言定型形式结构的熟语性、语言定型的联想性和语言定型民族性的特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号