首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 546 毫秒
1.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

2.
杨宪泽  肖明 《科技通报》2011,27(1):101-104,135
机器翻译的涉及的技术很多,单词处理是其中的一个重要核心.本文主要介绍单词处理的一些技术,其工作有三部分:第一部分提出最大匹配分词的改进算法;第二部分探讨汉英机器翻泽时名词的单复数处理算法;第三部分给出词性兼类处理的一些方法.  相似文献   

3.
《西藏科技》2015,(3):81
<正>西藏大学现代教育技术中心承担的2012年西藏自治区重点科研项目——《基于短语的藏汉统计机器翻译关键技术研究》,在藏语自动分词与词性标注、藏语语料库、基于短语的藏汉统计机器翻译技术等领域进行了深入研究,取得标志性研究成果——《阳光藏  相似文献   

4.
本文介绍了一种机器翻译框架,能够完成汉-英文本的自动翻译任务。对于输入句子,分别进行分词、词性标注和句法分析处理。在翻译转换之前,集成了词义消歧的结果以提高自动译文输出质量。  相似文献   

5.
董晓芳  曹晖  江涛 《科技风》2012,(17):60-61
本文针对藏文词法及句法的特点,借助开源统计机器翻译平台,搭建起基于短语的藏汉统计机器翻译系统,重点描述了系统中的藏文编码转换和藏文自动分词的实现方法.最后采用500句新闻领域藏文语料对翻译系统进行测试,取得了 Bleu值为0.3425的较好结果.  相似文献   

6.
微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。  相似文献   

7.
萧莉明  于宽  蔡珣 《现代情报》2007,27(4):146-147,150
本文设计了一个有效的基于贝叶斯分类器的中文期刊自动分类系统。首先,该系统以期刊的名称作为惟一的标引内容,并利用自动分词技术将期刊名称分成待分类的样本集;其次,通过对图书馆的样本数据进行训练建立的分类库,本文使用贝叶斯分类器实现中文期刊的自动分类。实验结果表明,该分类器对中文期刊的分类具有很好的高效性和准确性。  相似文献   

8.
汉语自动分词技术的最新发展及其在信息检索中的应用   总被引:2,自引:0,他引:2  
岳涛 《情报杂志》2005,24(4):55-57,60
分析了汉语自动分词与自然语言处理、自动分词与信息检索之间的关系,在此基础上,介绍了近年来自动分词系统实现的技术,分析了自动分词技术在信息检索中应用的有关问题。  相似文献   

9.
自动分词在中文信息检索中的应用   总被引:3,自引:0,他引:3  
董小芸  刘俊熙 《情报杂志》2003,22(12):65-66,69
论述了几种分词方法和算法,并阐述了自动分词在信息检索中的应用。  相似文献   

10.
迟海 《科技风》2012,(21):198
术语是通过语言或文字来表达所限定专业概念的约定性语言符号,其集中体现和负载了一个学科领域的核心知识。中文专利辅助阅读是基于术语自动抽取(AutomaticTermExtraction:ATE)的一项应用型项目。也是自然语言处理的一项重要课题,在机器翻译、信息检索、文本分类和文本摘要等领域有着广泛的应用。本文研究用基于CRF工具包自动抽取术语问题,通过对抽取出的术语文档进行处理,获得一个标注好的术语文档,及其实现过程中涉及到基于中文分词处理的一系列算法以及数据结构等问题进行剖析,有效提高了中文专利阅读的效率及准确性。  相似文献   

11.
周明  李生 《情报科学》1993,14(2):49-53
理想的机器翻译系统应该是全自动高质量的批处理式系统,在目前的计算语言学发展水平下,计算机还无法彻底解决自然语言的错综复杂现象,达到全自动高质量的翻译。本文认为人机交互的方法是最自然的手段,用户易学易会,具有广阔的发展前景。文章详细地分析归纳汉—英机器翻译的歧义问题,总结了现有的解决歧义的手段,提出了用人机对话解决歧义问题的交互式汉—英机器翻译的思想,并从语言学的角度提供了论据。基于这一思想设计的CEMT—Ⅱ汉英机器翻译系统模型已基本完成。  相似文献   

12.
机器翻译中设计的两个算法   总被引:3,自引:2,他引:1  
在机器翻译的研究中,混合式方法是一种好方法。本文的工作主要有两部分:第一部分讨论直接散列检索算法;第二部分讨论近似机器翻译算法。  相似文献   

13.
江莉  王茎  张四红  程玲 《科教文汇》2013,(7):109-111
对于“情”这个中医术语,一直存在两个英译版本:“essence”和“spirit”。本文以中医术语中“精”的概念为例,运用AntConc和Sketch Erigine两种数据库搜索工具,使用BNC,对目前存在的两个常见英译版本“essence”和“Spirit”进行差异性研究。研究发现与Spirit相比,essence在语义内涵和搭配特征上更接近于中医中“精”的概念。本研究旨在为中医术语翻译中特定术语的选词提供数据依据。  相似文献   

14.
通过严格标准,筛选出10大方面共35个贵州少数民族文化词汇作为目标词汇,检索、分析这些词汇在美国当代英语语料库中的频次情况、分布特征。检索发现,贵州少数民族文化在当今美国关注度不高。从经济发展相对滞后、传播主体官方为主、传播渠道狭窄、人才匮乏等方面分析了造成这一现状的原因。加快经济发展、继续加大政府扶持力度、扩宽传播渠道、提高文化外宣翻译质量、培养引进传播人才、深入挖掘贵州少数民族文化等是提升贵州少数民族文化在美国关注度的可行性策略。  相似文献   

15.
自然语言处理的句法分析和规则索引   总被引:7,自引:2,他引:7  
杨宪泽 《科技通报》2002,18(6):470-473,478
在自动翻译的设计中,句法分析是核心问题。本文的研究背景是自然语言处理系统,其工作有两部分;第一部分讨论了句法分析;第二部分提出了规则索引算法。  相似文献   

16.
本文是关于汉语数字成语的英译问题,笔者概括总结了几种常见的翻译方法,希望能为汉英翻译和跨文化交际提供一些建设性的意见。  相似文献   

17.
曲琳琳 《情报科学》2021,39(8):132-138
【目的/意义】跨语言信息检索研究的目的即在消除因语言的差异而导致信息查询的困难,提高从大量纷繁 复杂的查找特定信息的效率。同时提供一种更加方便的途径使得用户能够使用自己熟悉的语言检索另外一种语 言文档。【方法/过程】本文通过对国内外跨语言信息检索的研究现状分析,介绍了目前几种查询翻译的方法,包括: 直接查询翻译、文献翻译、中间语言翻译以及查询—文献翻译方法,对其效果进行比较,然后阐述了跨语言检索关 键技术,对使用基于双语词典、语料库、机器翻译技术等产生的歧义性提出了解决方法及评价。【结果/结论】使用自 然语言处理技术、共现技术、相关反馈技术、扩展技术、双向翻译技术以及基于本体信息检索技术确保知识词典的 覆盖度和歧义性处理,通过对跨语言检索实验分析证明采用知识词典、语料库和搜索引擎组合能够提高查询效 率。【创新/局限】本文为了解决跨语言信息检索使用词典、语料库中词语缺乏的现象,提出通过搜索引擎从网页获 取信息资源来充实语料库中语句对不足的问题。文章主要针对中英文信息检索问题进行了探讨,解决方法还需要 进一步研究,如中文切词困难以及字典覆盖率低等严重影响检索的效率。  相似文献   

18.
马东  李敏  曹钦琦 《科教文汇》2013,(14):97-97,102
本文以宁波家居展为例,通过对翻译方法的分类分析,完成对商标汉英翻译中的文化因素的探讨。本文指出,商标翻译应当尊重文化差异,基于文化内涵,在充分考虑文化因素的基础上做恰当的翻译,使得商标更吻合当地文化,更具企业的文化特色,更好地面对全球化竞争。  相似文献   

19.
党秋菊 《科教文汇》2011,(14):142-143
语言是思维活动方式的外在表现,思维差异使汉英两种语言的句法结构和表达偏好上均存在一定差异。本文探讨思维模式差异所导致的英译汉时句子视点的切换与转移问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号