共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
音节字的排序是藏文字词排序的基础,但目前还没有统一的规范标准。本文对《新编藏文字典》中任意部首内部的音节排序做一种同一而合理的调整,提出一种形式简便,运算快捷的排序模型,供以参考。 相似文献
4.
随着互联网不断发展,境外反动势力利用网络传播不良信息呈愈演愈烈之势,尤其在藏文信息方面。利用最大熵模型,可对网络藏文文本进行分类,识别不良藏文文本及正常藏文文本。用互信息进行特征提取,建立藏文不良文本库用以训练最大熵模型,利用Opennlp最大熵工具包实现功能,利用最大熵模型求出文档属于不良文本和合法文本的概率,通过分析准确率、召回率对识别结果进行分析。通过实验实现了最大熵算法进行藏文文本分类功能,用最大熵算法进行藏文不良文本识别效果比较明显。 相似文献
5.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。 相似文献
6.
通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GA—BP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。 相似文献
7.
随着藏文编码字符集国际标准的制定,以及微软的第一个全面支持藏文的Windows Vista操作系统的发布,计算机对藏文的处理能力达到了与英文和汉文相同的级别.藏文垃圾邮件正处在萌发中,将对国家安全和社会稳定带来了威胁.贝叶斯算法广泛用于中、英文垃圾邮件过滤中,但藏文有其独特的语言特性,不能把国内外的研究成果直接应用到藏文垃圾邮件的过滤中.本文介绍了朴素贝叶斯算法的基本原理和藏文垃圾邮件的特殊性,最后分析了基于贝叶斯的藏文垃圾邮件过滤器的性能的几个因素. 相似文献
8.
9.
在信息发达的当今社会,传统的人工翻译无法满足西藏社会发展对于藏文翻译的巨大需求,藏文机器翻译的实现是亟待解决的问题,文章采用基于规则的方法研究藏文机器翻译,提出了基于句型模板的汉藏句型转换算法,结合源文预处理和词典知识库实现汉藏机器互译。 相似文献
10.
11.
Windows XP在个人计算机中还占有重要的地位,而基于国家/国际编码标准的藏文在Windows XP上使用时,经常遇到不知如何解决断字、显示和文件名称等方面的问题,下面笔者简单叙述几个问题的解决方法. 相似文献
12.
本文通过对藏文古籍文献的分类和特点的分析,探讨了藏文文献的收集与开发的方法和途径,以期在网络环境下更大限度的发挥藏文文献的学术价值和社会意义.为促进我国的藏学研究事业和民族教育事业,提供一定的借鉴和参考. 相似文献
13.
14.
15.
16.
17.
18.
微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。 相似文献
19.
藏文分词是藏文信息处理的基础,歧义问题是藏文分词的一个难点,而交集型歧义问题占藏文分词歧义问题的90%以上,因此,对交集型歧义问题的研究是藏文分词研究的一个重点。本文通过统计分析,按藏文文本中交集型歧义的规则特点,给出了一种改进的藏文分词交集型歧义消解方法,从而进一步提高了藏文自动分词的准确率。 相似文献