共查询到19条相似文献,搜索用时 546 毫秒
1.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。 相似文献
2.
机器翻译的涉及的技术很多,单词处理是其中的一个重要核心.本文主要介绍单词处理的一些技术,其工作有三部分:第一部分提出最大匹配分词的改进算法;第二部分探讨汉英机器翻泽时名词的单复数处理算法;第三部分给出词性兼类处理的一些方法. 相似文献
3.
4.
本文介绍了一种机器翻译框架,能够完成汉-英文本的自动翻译任务。对于输入句子,分别进行分词、词性标注和句法分析处理。在翻译转换之前,集成了词义消歧的结果以提高自动译文输出质量。 相似文献
5.
6.
微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。 相似文献
7.
8.
汉语自动分词技术的最新发展及其在信息检索中的应用 总被引:2,自引:0,他引:2
分析了汉语自动分词与自然语言处理、自动分词与信息检索之间的关系,在此基础上,介绍了近年来自动分词系统实现的技术,分析了自动分词技术在信息检索中应用的有关问题。 相似文献
9.
10.
11.
理想的机器翻译系统应该是全自动高质量的批处理式系统,在目前的计算语言学发展水平下,计算机还无法彻底解决自然语言的错综复杂现象,达到全自动高质量的翻译。本文认为人机交互的方法是最自然的手段,用户易学易会,具有广阔的发展前景。文章详细地分析归纳汉—英机器翻译的歧义问题,总结了现有的解决歧义的手段,提出了用人机对话解决歧义问题的交互式汉—英机器翻译的思想,并从语言学的角度提供了论据。基于这一思想设计的CEMT—Ⅱ汉英机器翻译系统模型已基本完成。 相似文献
12.
13.
14.
通过严格标准,筛选出10大方面共35个贵州少数民族文化词汇作为目标词汇,检索、分析这些词汇在美国当代英语语料库中的频次情况、分布特征。检索发现,贵州少数民族文化在当今美国关注度不高。从经济发展相对滞后、传播主体官方为主、传播渠道狭窄、人才匮乏等方面分析了造成这一现状的原因。加快经济发展、继续加大政府扶持力度、扩宽传播渠道、提高文化外宣翻译质量、培养引进传播人才、深入挖掘贵州少数民族文化等是提升贵州少数民族文化在美国关注度的可行性策略。 相似文献
15.
自然语言处理的句法分析和规则索引 总被引:7,自引:2,他引:7
在自动翻译的设计中,句法分析是核心问题。本文的研究背景是自然语言处理系统,其工作有两部分;第一部分讨论了句法分析;第二部分提出了规则索引算法。 相似文献
16.
本文是关于汉语数字成语的英译问题,笔者概括总结了几种常见的翻译方法,希望能为汉英翻译和跨文化交际提供一些建设性的意见。 相似文献
17.
【目的/意义】跨语言信息检索研究的目的即在消除因语言的差异而导致信息查询的困难,提高从大量纷繁
复杂的查找特定信息的效率。同时提供一种更加方便的途径使得用户能够使用自己熟悉的语言检索另外一种语
言文档。【方法/过程】本文通过对国内外跨语言信息检索的研究现状分析,介绍了目前几种查询翻译的方法,包括:
直接查询翻译、文献翻译、中间语言翻译以及查询—文献翻译方法,对其效果进行比较,然后阐述了跨语言检索关
键技术,对使用基于双语词典、语料库、机器翻译技术等产生的歧义性提出了解决方法及评价。【结果/结论】使用自
然语言处理技术、共现技术、相关反馈技术、扩展技术、双向翻译技术以及基于本体信息检索技术确保知识词典的
覆盖度和歧义性处理,通过对跨语言检索实验分析证明采用知识词典、语料库和搜索引擎组合能够提高查询效
率。【创新/局限】本文为了解决跨语言信息检索使用词典、语料库中词语缺乏的现象,提出通过搜索引擎从网页获
取信息资源来充实语料库中语句对不足的问题。文章主要针对中英文信息检索问题进行了探讨,解决方法还需要
进一步研究,如中文切词困难以及字典覆盖率低等严重影响检索的效率。 相似文献
18.
19.
语言是思维活动方式的外在表现,思维差异使汉英两种语言的句法结构和表达偏好上均存在一定差异。本文探讨思维模式差异所导致的英译汉时句子视点的切换与转移问题。 相似文献