期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李洪政赵凯胡韧奋蒋宏飞朱筠晋耀红《情报工程》2017,3(3):105-115

面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。相似文献

2.

基于枢轴语言的平行语料构建方法

下载免费PDF全文

单华张玉洁周雯徐金安陈钰枫《情报工程》2017,3(3):029-039

平行语料库的规模对于统计机器翻译性能的提高具有重要作用,但是平行语料库的人工构建成本很高。针对这个问题,本文提出了一种低成本高效率的平行语料构建方法,利用枢轴语言作为桥梁,借助已有的机器翻译技术并融合主动学习方法构建目标语言对的大规模高质量平行语料库。本文通过以英语作为枢轴语言构建日汉平行语料库的实例研究,利用成熟的基于短语的统计机器翻译技术,描述了基于译文自动评测的良好译文选择方法、基于主动学习的语料选取方法、以及翻译系统的更新迭代和评价实验。实验结果表明,本文提出的方法能够快速构建日汉平行语料,并有效提高日汉翻译系统的性能。相似文献

3.

第一届亚洲翻译研讨会KyotoEBMT系统报告

下载免费PDF全文

John Richardson Fabien Cromières Toshiaki Nakazaw Sadao Kurohashi 何彦青刘建辉《情报工程》2017,3(3):047-054

本文介绍了基于实例的机器翻译引擎KyotoEBMT 的框架。为了保留语句的非局部结构,我们的系统运用“树到树”的方法对源语言和目标语言都进行了依存句法分析。我们的系统凭借在线的实例匹配和灵活的解码装置确保其最优的翻译效果。实验表明：该系统与当前流行的基于短语的统计机器翻译系统的BLEU 得分相当。该系统已开源可得。相似文献

4.

机器翻译系统融合方法及其应用探究

何彦青石崇德于薇张均胜王惠临《数字图书馆论坛》2011,(12):32-38

多机器翻译系统融合技术能够对不同机器翻译系统的输出结果有效地进行融合,产生更好的翻译性能,因此该技术成为机器翻译研究领域的一个热点问题。文章介绍了中国科学技术信息研究所（ISTIC）参加第七届全国机器翻译研讨会机器翻译评测的情况。本单位参加了英汉科技领域的机器翻译评测项目。文章阐述了本单位机器翻译系统的实现框架以及实施细节,并分析了它们在评测数据上的性能表现,最后对机器翻译系统融合方法目前的现状进行讨论,并对该系统融合方法进行总结和展望。相似文献

5.

子句对齐及其在专利统计机器翻译中的应用

何彦青张娟《中国科技资源导刊 (中国信息导报)》2014,(4):86-93

针对专利文献句子偏长的特点,将统计机器翻译中的训练语料进行子句切割获取双语的子句序列,再采用统计和规则相结合的策略来生成子句对齐,建立基于简单子句的双语语料来重新训练统计机器翻译系统,在一定程度上改善了原有双语训练语料中的短语对齐和词对齐,可以更为深入地利用平行语料中蕴含的翻译信息,应用于专利统计机器翻译中,在NTCIR-9的测试集上进行实验比较,获得较为满意的翻译效果。相似文献

6.

跨语言检索中机器翻译技术的应用和进展 总被引：2，自引：0，他引：2

刘群骆卫华《数字图书馆论坛》2006,(9):12-19

本文以跨语言检索为背景,主要介绍了机器翻译技术的应用和进展.文章介绍了跨语言检索中机器翻译技术的应用形式,简单回顾了机器翻译技术发展历史中出现的各种方法及其基本思想和优缺点,特别是近年来统计机器翻译的发展.本文通过一个实例较为详细地介绍了目前主流的基于短语的统计机器翻译原理,然后通过一个实际的新闻长句子对几个典型的基于规则的和基于统计的机器翻译系统的翻译结果给出了细致的比较和分析.最后对机器翻译在跨语言检索中的应用前景做出了展望. 相似文献

7.

融合不同语义知识的中国古代典籍机器翻译研究

吴梦成林立涛吴娜许乾坤王东波《情报资料工作》2024,(2):97-104

[目的/意义]文章旨在探究将不同语义知识融入机器翻译模型能否增强机器翻译的效果以及何种语义知识的作用更为显著,以助力机器翻译研究与中华优秀传统文化的传承与传播。[方法/过程]研究选取了30万对精加工的《二十四史》“古代汉语-现代汉语”平行语料作为实验数据,基于神经机器翻译OpenNMT模型,通过三种不同的特征融合方法,将词边界知识、词性知识、实体知识和依存句法知识分别融入机器翻译模型的训练过程中。[结果/结论]不同语义知识与模型的融合对典籍翻译效果有不同的影响,词边界知识、词性知识、实体知识对机器翻译任务有一定的贡献且实体知识的贡献最大,依存句法知识无明显作用。相似文献

8.

神经网络语言模型在统计机器翻译中的应用

下载免费PDF全文

张家俊宗成庆《情报工程》2017,3(3):021-028

近两年来,神经机器翻译（Neural Machine Translation, NMT）模型主导了机器翻译的研究,但是统计机器翻译（Statistical Machine Translation, SMT）在很多应用场合（尤其是专业领域）仍有较强的竞争力。如何利用深度学习技术提升现有统计机器翻译的水平成为研究者们关注的主要问题。由于语言模型是统计机器翻译中最核心的模块之一,本文主要从语言模型的角度入手,探索神经网络语言模型在统计机器翻译中的应用。本文分别探讨了基于词和基于短语的神经网络语言模型,在汉语到英语和汉语到日语的翻译实验表明神经网络语言模型能够显著改善统计机器翻译的译文质量。相似文献

9.

基于机器翻译的图书馆多语言自动翻译平台构建策略

刘莉王怡邵波《图书馆学研究》2022,(1):32-40

随着图书馆趋于数字化、智慧化的转型,提供多样性服务已是图书馆服务发展的大势所趋,多语言翻译服务急需开展以及完善.构建多语言自动翻译平台能够为图书馆多语言翻译服务提供理论框架借鉴与平台支撑.机器翻译技术应用于多语言翻译领域具有明显优势.文章采用文献分析法以及网络调查法,分析国内外图书馆多语言翻译的研究现状,结合机器翻译概... 相似文献

10.

双语句对翻译众包辅助平台设计与实现

下载免费PDF全文

高影繁李辉徐红姣崔笛《情报工程》2017,3(3):086-096

本文提出了一种采用众包工作模式的科技领域日汉机器翻译辅助平台的构建方法。在充分调研众包生产模式、质量控制等研究和实践的基础上,设计了集用户管理、团队管理、语料管理、机器辅助翻译、术语辅助翻译等功能为一体的双语句对生产平台,针对不同角色和不同技术类别分别构建出相应的功能模块。该平台在众包工作模式的基础上结合了多源信息辅助译者完成翻译,翻译效率高且翻译成本低,平台的开发和运行为科技领域实用型日汉机器翻译系统的建设提供了有力支撑。相似文献