共查询到20条相似文献,搜索用时 375 毫秒
1.
机器翻译研究用计算机实现不同自然语言之间的翻译。自第一台计算机诞生开始,人们一直在研究和探索高质量高效率的机器翻译技术。近年来,基于规则的机器翻译、基于实例的机器翻译和基于统计的机器翻译这几种主要的翻译模式共同存在且相互补充,并有不断融合之势。随着中国和日本在科技、经济和文化交流的不断深入,机器翻译研究对于打破汉语和日语之间的语言壁垒进而推进中日两国各个领域的交流与合作具有重要的应用价值。中国和日本两国机器翻译研究人员已经开展了大量的汉日/日汉机器翻译的理论研究与系统研制,已取得了有效的成果,但距离大规模实际应用和高标准的翻译质量的要求尚有差距。为此,中日两国机器翻译人员有必要在汉日/日汉机器翻译技术与系统研制方面展开合作,特别是在对齐平行文本、实例词典、专业术语词典以及句法分析等共同课题方面展开合作。文章介绍了中日两国机器翻译研究的进展并加以比较,对中日两国在机器翻译领域的合作做了分析与展望。 相似文献
2.
3.
跨语言检索中机器翻译技术的应用和进展 总被引:2,自引:0,他引:2
本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展.文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点,特别是近年来统计机器翻译的发展.本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析.最后对机器翻译在跨语言检索中的应用前景做出了展望. 相似文献
4.
文章将对在“中美百万册数字图书馆(简称CADAL)”项目中提供双语服务所涉及的机器翻译技术以及如何将该技术在数字图书馆建设中应用进行讨论并提出解决方法。 相似文献
5.
6.
7.
再谈国内机器翻译软件 总被引:1,自引:1,他引:0
葛敬民 《现代图书情报技术》1999,(3):62-63
预计到2000年,我国计算机的装机量将达10O0万台,城镇家庭拥有率将从目前的1%提高到10%以上,上网人数将达3000万。盖茨在1997年12月来华时称:5年后,每个中国人的名片上都将印上网址。然而,网上大量的外文信息会令多数国人困惑和无奈,提高外语水平的作法是远水不解近渴。因此,上网后面临的“语障”,还得借助或依赖于机器翻译软件来克服。问题在于:机器翻译软件的发展能否满足国人的要求?我国把机器翻译列为“863”计划,经过国内机器翻译专家多年来的不懈努力,近年来已有多种翻译软件上市,但距人们的要求还有相当大的差距。目… 相似文献
8.
9.
近年,中文信息在日本受到高度瞩目,为满足日文用户无障碍地检索中文信息的需求,以跨语言信息检索为重要目的之一的日中·中日翻译系统在日本受到了从政府到企业的高度重视,该领域的研究极其活跃.文章在重申跨语言信息检索概念、介绍日本机器翻译研究历史基础之上,论述了日本日中·中日机器翻译系统国家项目、大学研究项目和企业研究项目的整体状况.最后,给出了在跟踪、借鉴日本经验同时需要注意的相关问题. 相似文献
10.
介绍本体作为知识工程领域的一种新方法被引入到汉英机器翻译的研究中,用来协助机器翻译中对自然语言语义的理解和计算;指出本体为源语言与目标语言的词汇提供中性化、形式化的表达,其概念语义网络为自然语言的歧义消除提供世界知识、语义空间,本体工具本身所具有的推理功能也使机器翻译的语义处理更为便捷,本体已逐渐成为语义处理的新的理论基础及工具。 相似文献
11.
多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题.常用的多机器翻译系统融合技术可以分为句子级、短语级和词级融合.在对不同级别的系统融合技术进行分析的基础上,本文提出基于词和短语的多机器翻译系统融合方法.首先,采用词级的系统融合技术构建混淆网络,将混淆网络转化为短语表.然后,基于该短语表利用短语级的系统融合技术中的再解码方法进行混淆网络解码生成融合结果.该方法既保证了融合系统所构建的混淆网络的最大可能性,又可以利用更多的特征进行混淆网络解码.我们将基于词和短语的多机器翻译系统融合方法在两个测试集上分别实验并进行比较,获得了较为满意的翻译效果. 相似文献
12.
平行语料库的规模对于统计机器翻译性能的提高具有重要作用,但是平行语料库的人工构建成本很高。针对这个问题,本文提出了一种低成本高效率的平行语料构建方法,利用枢轴语言作为桥梁,借助已有的机器翻译技术并融合主动学习方法构建目标语言对的大规模高质量平行语料库。本文通过以英语作为枢轴语言构建日汉平行语料库的实例研究,利用成熟的基于短语的统计机器翻译技术,描述了基于译文自动评测的良好译文选择方法、基于主动学习的语料选取方法、以及翻译系统的更新迭代和评价实验。实验结果表明,本文提出的方法能够快速构建日汉平行语料,并有效提高日汉翻译系统的性能。 相似文献
13.
本文介绍了基于实例的机器翻译引擎KyotoEBMT 的框架。为了保留语句的非局部结构,我们的系统运用“树到树”的方法对源语言和目标语言都进行了依存句法分析。我们的系统凭借在线的实例匹配和灵活的解码装置确保其最优的翻译效果。实验表明:该系统与当前流行的基于短语的统计机器翻译系统的BLEU 得分相当。该系统已开源可得。 相似文献
14.
[目的/意义]文章旨在探究将不同语义知识融入机器翻译模型能否增强机器翻译的效果以及何种语义知识的作用更为显著,以助力机器翻译研究与中华优秀传统文化的传承与传播。[方法/过程]研究选取了30万对精加工的《二十四史》“古代汉语-现代汉语”平行语料作为实验数据,基于神经机器翻译OpenNMT模型,通过三种不同的特征融合方法,将词边界知识、词性知识、实体知识和依存句法知识分别融入机器翻译模型的训练过程中。[结果/结论]不同语义知识与模型的融合对典籍翻译效果有不同的影响,词边界知识、词性知识、实体知识对机器翻译任务有一定的贡献且实体知识的贡献最大,依存句法知识无明显作用。 相似文献
15.
16.
跨语言信息检索方法概述 总被引:4,自引:0,他引:4
本文介绍了跨语言信息检索问题的由来与发展,通过对单语言信息检索技术的介绍引入了跨语言检索的关键问题,并分别介绍了跨语言信息检索中基于词典、基于语料和基于机器翻译模块这三种主流方法,最后对跨语言检索的一体化方法等较新的思想和跨语言检索评测等做了简要说明. 相似文献
17.
18.
19.
20.
近两年来,神经机器翻译(Neural Machine Translation, NMT)模型主导了机器翻译的研究,但是统计机器翻译(Statistical Machine Translation, SMT)在很多应用场合(尤其是专业领域)仍有较强的竞争力。如何利用深度学习技术提升现有统计机器翻译的水平成为研究者们关注的主要问题。由于语言模型是统计机器翻译中最核心的模块之一,本文主要从语言模型的角度入手,探索神经网络语言模型在统计机器翻译中的应用。本文分别探讨了基于词和基于短语的神经网络语言模型,在汉语到英语和汉语到日语的翻译实验表明神经网络语言模型能够显著改善统计机器翻译的译文质量。 相似文献