首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
多词表达是自然语言中的常见现象,其自动提取对很多自然语言处理任务有着举足轻重的作用。本研究以Google公司发布的基于公共网页的1至5元文法语料库作为词频统计的依据,同时结合自动词性标注的信息,对英国国家语料库的书面语材料部分进行多词表达的自动提取。研究结果表明,该方法能够充分利用Google语料库的精确词频信息,从而提高了多词表达抽取的准确率,并且能够较好地缓解数据稀疏现象带来问题。  相似文献   

2.
自然语言处理技术是当前现代科学技术的一个研究热点.不同语言通过计算机进行翻译、对话,解决自动翻译等问题,是很多科技人员致力研究的一项大的课题.本文对自然语言处理的基本理论和方法进行了综述,并对自然语言处理的发展历史和最新技术进行了阐述,最后对自然语言处理中的句法分析做了简要的分析.  相似文献   

3.
张翯  裴云红 《科教文汇》2013,(28):126-127
语料库语言学研究这一新兴领域因其独特的研究视角及应用前景越来越受到国内外学者的关注,而将其应用于语言教学也成为研究的重点。我国学者在语料库语言学与英语教学的结合方面已经取得了一定的成绩,但在基础教学及微观应用方面涉猎较少,尚待深入研究。本文以英语阅读教学为切入点,论述语料库语言视角下英语阅读教学的必要性和可行性,并从语篇导入、文体分析、语境猜词三个方面探讨基于语料库的英语阅读教学。  相似文献   

4.
语料库语言学研究这一新兴领域因其独特的研究视角及应用前景越来越受到国内外学者的关注,而将其应用于语言教学也成为研究的重点。我国学者在语料库语言学与英语教学的结合方面已经取得了一定的成绩,但在基础教学及微观应用方面涉猎较少,尚待深入研究。本文以英语阅读教学为切入点,论述语料库语言视角下英语阅读教学的必要性和可行性,并从语篇导入、文体分析、语境猜词三个方面探讨基于语料库的英语阅读教学。  相似文献   

5.
在全球经济一体化不断发展的当今社会,英语语言已成为人们交流的一种重要工具,是人们必备的生存技能,探究英语语言成为时代发展的需要,也是英语语言研究的重要任务。语料库作为英语语言研究的主流工具,被迅速应用于英语语言研究领域,并在英语语言研究方面发挥了重要作用,为英语语言研究带来了一种新的研究思路。新形势下,积极探讨语料库在英语语言研究领域中的应用,是进一步推动英语语言研究快速发展的重要措施。  相似文献   

6.
基于网络的语料库是近年来新兴的语言学习资源,其最大特点是语言的海量提供和材料的自然真实性。本文将浅议英语语料库这种新型教学学习资源对我国英语教学的内容、语法教学、词汇教学、学生语言错误分析和学生自主学习等方面产生积极的影响和推动作用,并对语料库的局限性及其应用中应注意的问题予以简要分析。  相似文献   

7.
批改网是互联网语料库技术与云计算不断发展的产物,对帮助英语学习者对英语写作、翻译等语言输出能力进行练习起到了积极作用。本文通过分析大学英语写作特点及批改网的使用情况,对其在大学英语写作教学中的应用进行分析总结。  相似文献   

8.
康大伟 《科教文汇》2009,(36):144-144,159
语料库是收集自然出现的语言材料的大型电子文库。语料库语言学是以语料库为基础对语言进行分析、描述和研究的新兴学科。英语语料库对我国英语教学中的词汇教学、语法教学、教材编写、词典编撰、学生自主学习能力培养等方面有着积极影响,在畜牧兽医行业英语教学中适当采用语料库手段,将会对教学大纲制定、教学内容选取、教材词典编写、教学评估等起到重要的推动作用。  相似文献   

9.
刘亚玲 《内江科技》2009,30(10):20-20
基于BROWN、LOB、CLEC语料库的对比研究发现,在本族语语料库中,terribly具有明显的错综语义韵,而在中国英语学习者语料库中,terribly仅仅具有消极语义韵,说明中国英语学习者对英语单词的掌握具有片面性,应在教学中引进语料库,借助语料库的大量语言使用实例来理解词汇的意义和用法,提高英语学习效率。  相似文献   

10.
语料库集中了人类语言知识的宝藏。了解和掌握语料库知识对于英语教师说来大有裨益,因为语料库的语言研究可以打破传统教学思想的束缚和教学大纲的局限性,能够为语言教学提供丰富的词汇、短语、句子、篇章及其他类型的资料,丰富教学知识和智慧,解放教学观念。  相似文献   

11.
单楠 《科教文汇》2014,(35):100-101
口语表达是语言最基础、最核心的应用能力,口语水平的高低在一定程度上决定着语言交流的成效。高职高专英语教学坚持"实用为主,够用为辅"的原则,对高职高专学生来说,口语能力的培养尤为重要。但当前高职院校学生英语口语能力普遍偏低,对这一问题进行探究,有助于把握提高学生英语口语水平的对策及方法。  相似文献   

12.
The application of natural language processing (NLP) to financial fields is advancing with an increase in the number of available financial documents. Transformer-based models such as Bidirectional Encoder Representations from Transformers (BERT) have been successful in NLP in recent years. These cutting-edge models have been adapted to the financial domain by applying financial corpora to existing pre-trained models and by pre-training with the financial corpora from scratch. In Japanese, by contrast, financial terminology cannot be applied from a general vocabulary without further processing. In this study, we construct language models suitable for the financial domain. Furthermore, we compare methods for adapting language models to the financial domain, such as pre-training methods and vocabulary adaptation. We confirm that the adaptation of a pre-training corpus and tokenizer vocabulary based on a corpus of financial text is effective in several downstream financial tasks. No significant difference is observed between pre-training with the financial corpus and continuous pre-training from the general language model with the financial corpus. We have released our source code and pre-trained models.  相似文献   

13.
张晓杰 《科教文汇》2014,(5):77-77,79
计算机辅助语言教学(CALL)是一个相对较新、发展较迅速的学术领域。多媒体技术在外语教学中的应用不仅使外语学习走向自然习得,而且使整个学习过程向个别化、多终端、远距离的方向发展。本文以多媒体辅助下大学英语教学模式的转变为背景,提出大学英语课堂教学模式的合理性建议和教学策略,提供符合时代发展的大学英语教学方法。  相似文献   

14.
Cross-lingual semantic interoperability has drawn significant attention in recent digital library and World Wide Web research as the information in languages other than English has grown exponentially. Cross-lingual information retrieval (CLIR) across different European languages, such as English, Spanish, and French, has been widely explored; however, CLIR across European languages and Oriental languages is still in the initial stage. To cross language boundary, corpus-based approach is promising to overcome the limitation of the knowledge-based and controlled vocabulary approaches but collecting parallel corpora between European language and Oriental language is not an easy task. Length-based and text-based approaches are two major approaches to align parallel documents. In this paper, we investigate several techniques using these approaches and compare their performances in aligning English and Chinese titles of parallel documents available on the Web.  相似文献   

15.
司莉  何依 《现代情报》2016,36(6):165-170
语料库是指根据一定的方法收集的自然出现语料构成的电子数据库。2000年以来我国对多语言语料库的研究呈现快速上升的趋势。在全面文献调研的基础上,本文对我国多语言语料库的研究现状进行了归纳与梳理。国内学者对多语言语料库的研究多集中于语言学领域,其次是计算机领域。研究主题主要分布在多语言语料库的关键技术研究、多语言语料库的应用研究两大方面。  相似文献   

16.
王玮 《科教文汇》2014,(14):82-82
语言是一种交流工具,语言学习最终是为交际服务的,提高用英语进行交际的能力是外语教学的出发点和根本点。英语教学的目的就是培养和发展学生使用这种交际工具的能力,即培养学生的英语交际能力,听、说、读、写四种语言技能的训练必须为交际能力服务。本文根据笔者讲授大学公共英语课的亲身经历,从大学生的实际情况出发,探讨了中国大学英语教师应该采取哪些有效的语言输出策略来有效培养学生的英语交际能力。  相似文献   

17.
Knowledge acquisition and bilingual terminology extraction from multilingual corpora are challenging tasks for cross-language information retrieval. In this study, we propose a novel method for mining high quality translation knowledge from our constructed Persian–English comparable corpus, University of Tehran Persian–English Comparable Corpus (UTPECC). We extract translation knowledge based on Term Association Network (TAN) constructed from term co-occurrences in same language as well as term associations in different languages. We further propose a post-processing step to do term translation validity check by detecting the mistranslated terms as outliers. Evaluation results on two different data sets show that translating queries using UTPECC and using the proposed methods significantly outperform simple dictionary-based methods. Moreover, the experimental results show that our methods are especially effective in translating Out-Of-Vocabulary terms and also expanding query words based on their associated terms.  相似文献   

18.
曲琳琳 《情报科学》2021,39(8):132-138
【目的/意义】跨语言信息检索研究的目的即在消除因语言的差异而导致信息查询的困难,提高从大量纷繁 复杂的查找特定信息的效率。同时提供一种更加方便的途径使得用户能够使用自己熟悉的语言检索另外一种语 言文档。【方法/过程】本文通过对国内外跨语言信息检索的研究现状分析,介绍了目前几种查询翻译的方法,包括: 直接查询翻译、文献翻译、中间语言翻译以及查询—文献翻译方法,对其效果进行比较,然后阐述了跨语言检索关 键技术,对使用基于双语词典、语料库、机器翻译技术等产生的歧义性提出了解决方法及评价。【结果/结论】使用自 然语言处理技术、共现技术、相关反馈技术、扩展技术、双向翻译技术以及基于本体信息检索技术确保知识词典的 覆盖度和歧义性处理,通过对跨语言检索实验分析证明采用知识词典、语料库和搜索引擎组合能够提高查询效 率。【创新/局限】本文为了解决跨语言信息检索使用词典、语料库中词语缺乏的现象,提出通过搜索引擎从网页获 取信息资源来充实语料库中语句对不足的问题。文章主要针对中英文信息检索问题进行了探讨,解决方法还需要 进一步研究,如中文切词困难以及字典覆盖率低等严重影响检索的效率。  相似文献   

19.
陈志玲 《科教文汇》2011,(17):127-128
在许多高职高专英语口语课堂上,教师仍采用传统的以教师为中心的教学模式,这导致了学生没有机会练习英语口语。而英语口语课是一门旨在提高学生英语交流能力的课程。《英力克英语口语》课中大量的合作学习使学生不仅仅在课堂中学习和应用英语,更促使了他们在课后的生活和学习中使用英语。本文作者就合作学习在其所在学校的《英力克英语口语》课堂内外的应用进行了探讨。  相似文献   

20.
A main challenge in Cross-Language Information Retrieval (CLIR) is to estimate a proper translation model from available translation resources, since translation quality directly affects the retrieval performance. Among different translation resources, we focus on obtaining translation models from comparable corpora, because they provide appropriate translations for both languages and domains with limited linguistic resources. In this paper, we employ a two-step approach to build an effective translation model from comparable corpora, without requiring any additional linguistic resources, for the CLIR task. In the first step, translations are extracted by deriving correlations between source–target word pairs. These correlations are used to estimate word translation probabilities in the second step. We propose a language modeling approach for the first step, where modeling based on probability distribution provides two key advantages. First, our approach can be tuned easier in comparison with heuristically adjusted previous work. Second, it provides a principled basis for integrating additional lexical and translational relations to improve the accuracy of translations from comparable corpora. As an indication, we integrate monolingual relations of word co-occurrences into the process of translation extraction, which helps to extract more reliable translations for low-frequency words in a comparable corpus. Experimental results on an English–Persian comparable corpus show that our method outperforms the previous approaches in terms of both translation quality and the performance of CLIR. Indeed, the proposed method is naturally applicable to any comparable corpus, regardless of its languages. In addition, we demonstrate the significant impact of word translation probabilities, estimated in the second step of our approach, on the performance of CLIR.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号