共查询到20条相似文献,搜索用时 15 毫秒
1.
识别藏文单音节的基字是藏文排序的基础,识别算法的劣质直接影响到藏文排序的速度和效率。文章在对藏文编码体系和藏文单音节本身的语法特点进行研究的基础上,设计一种识别藏文单音节基字的算法,经试验表明已达到较高的准确率。 相似文献
2.
微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。 相似文献
3.
4.
随着藏文编码字符集国际标准的制定,以及微软的第一个全面支持藏文的Windows Vista操作系统的发布,计算机对藏文的处理能力达到了与英文和汉文相同的级别.藏文垃圾邮件正处在萌发中,将对国家安全和社会稳定带来了威胁.贝叶斯算法广泛用于中、英文垃圾邮件过滤中,但藏文有其独特的语言特性,不能把国内外的研究成果直接应用到藏文垃圾邮件的过滤中.本文介绍了朴素贝叶斯算法的基本原理和藏文垃圾邮件的特殊性,最后分析了基于贝叶斯的藏文垃圾邮件过滤器的性能的几个因素. 相似文献
5.
藏文分词是藏文信息处理的基础,歧义问题是藏文分词的一个难点,而交集型歧义问题占藏文分词歧义问题的90%以上,因此,对交集型歧义问题的研究是藏文分词研究的一个重点。本文通过统计分析,按藏文文本中交集型歧义的规则特点,给出了一种改进的藏文分词交集型歧义消解方法,从而进一步提高了藏文自动分词的准确率。 相似文献
6.
7.
8.
9.
通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GA—BP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。 相似文献
10.
随着互联网不断发展,境外反动势力利用网络传播不良信息呈愈演愈烈之势,尤其在藏文信息方面。利用最大熵模型,可对网络藏文文本进行分类,识别不良藏文文本及正常藏文文本。用互信息进行特征提取,建立藏文不良文本库用以训练最大熵模型,利用Opennlp最大熵工具包实现功能,利用最大熵模型求出文档属于不良文本和合法文本的概率,通过分析准确率、召回率对识别结果进行分析。通过实验实现了最大熵算法进行藏文文本分类功能,用最大熵算法进行藏文不良文本识别效果比较明显。 相似文献
11.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。 相似文献
12.
13.
14.
现今的民族地区图书馆或收藏藏文文献的机构,若想顺应信息化、数字化、网络化时代发展的步伐,与时俱进,谋求发展,使藏文文献资源的建设、管理、利用尽快实现信息化,就必须依靠特色数据库及特色服务、将藏文文献相关数据建立产权属于自己的数据库,它是网络化时代藏文文献资源共享的基础。鉴于目前藏文文献数据库建设中存在诸多问题的现状,对藏文文献数据库建设与调查研究就显得尤为重要。文章通过对国内外藏文文献数据库建设的理论与实践研究现状进行概括性述评,阐述藏文文献数据库建设实证调查研究的必要性及其价值与意义,以期为藏文文献数据库的建设与研究者提供参考。 相似文献
15.
文章概述了2005~2013年国内藏文数字图书馆研究的进展及热点,从其藏文数字图书馆的概念、特点及各种技术在藏文数字图书馆中的应用、元数据研究成果,做一梳理并进行分析综合,以便揭示藏文数字图书馆的研究现状、研究重点和研究方向,为今后的研究者以启示。 相似文献
16.
17.
18.
高强 《科技成果管理与研究》2014,(9):49-49
藏文被称作“写在世界屋脊上的文字”,创始于吐蕃王朝立国之君松赞干布时期,记载和传承着藏民族悠久的文化,是世界上最古老的文字之一,也是藏民族至今最基本的交流工具。随着信息化时代的到来,藏文电子化成为必然需求。为了传承、保护、发展民族优秀文化,西藏大学依托计算机应用技术和藏语言文学两个自治区重点学科,于2006年成立了藏文信息技术研究中心,2007年被批准为“藏文信息技术教育部工程研究中心”,2011年被批准为“藏文信息技术国家地方联合工程研究中心”。在西藏大学藏文信息技术研究中心全体研究人员的努力下,这种古老文字正焕发着全新的生命力。 相似文献
19.
本文通过对藏文古籍文献的分类和特点的分析,探讨了藏文文献的收集与开发的方法和途径,以期在网络环境下更大限度的发挥藏文文献的学术价值和社会意义.为促进我国的藏学研究事业和民族教育事业,提供一定的借鉴和参考. 相似文献
20.
论述了开发建设藏文古籍文献数据库的重要意义,提出了建设藏文古籍文献数据库涉及的标准问题和数据库系统的结构,并指出了藏文古籍文献数据库系统建设过程中可能存在的一些问题。 相似文献