首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
识别藏文单音节的基字是藏文排序的基础,识别算法的劣质直接影响到藏文排序的速度和效率。文章在对藏文编码体系和藏文单音节本身的语法特点进行研究的基础上,设计一种识别藏文单音节基字的算法,经试验表明已达到较高的准确率。  相似文献   

2.
微软公司以叠置引擎和OpenType字库技术为基础,于2007年推出了基于藏文国际标准编码Unicode字符动态组合的藏文系统。该系统支持与藏文书写方式相一致的输入法,并能解决国内其他藏文系统普遍存在的缺字问题,其发展趋势很强,已成为藏文资源及藏文应用软件开发的主流平台。藏文分词作为信息处理的基础性工作之一,在藏文信息检索、自动校对、机器翻译等领域有着广泛的应用,所以很有必要对Unicode藏文文本进行分词研究。  相似文献   

3.
近几年来在我国政府和有关部委的大力支持下,藏文信息处理技术得到了空前的发展,基于国际国家标准的藏文应用软件相继研发成功.本文就围绕国内外第一款基于藏文编码字符集(基本集、扩充集A和B准)国际国家标准的中标普华藏文办公软件,重点论述了在藏文办公软件中解决藏文文本自动断行的问题和藏文自动排版技术的实现方法.  相似文献   

4.
随着藏文编码字符集国际标准的制定,以及微软的第一个全面支持藏文的Windows Vista操作系统的发布,计算机对藏文的处理能力达到了与英文和汉文相同的级别.藏文垃圾邮件正处在萌发中,将对国家安全和社会稳定带来了威胁.贝叶斯算法广泛用于中、英文垃圾邮件过滤中,但藏文有其独特的语言特性,不能把国内外的研究成果直接应用到藏文垃圾邮件的过滤中.本文介绍了朴素贝叶斯算法的基本原理和藏文垃圾邮件的特殊性,最后分析了基于贝叶斯的藏文垃圾邮件过滤器的性能的几个因素.  相似文献   

5.
藏文分词是藏文信息处理的基础,歧义问题是藏文分词的一个难点,而交集型歧义问题占藏文分词歧义问题的90%以上,因此,对交集型歧义问题的研究是藏文分词研究的一个重点。本文通过统计分析,按藏文文本中交集型歧义的规则特点,给出了一种改进的藏文分词交集型歧义消解方法,从而进一步提高了藏文自动分词的准确率。  相似文献   

6.
汉语和藏文同属于记录语言的书写符号,二者在检验原理与检验方法上基本相同,但是,藏文是由30个字母组成的拼音文字,有着自己固定的语法,它们在发音、构句、书写等方面与汉字截然不同。这就决定了我们在检验藏文笔迹时,不能照搬检验汉字笔迹的一套模式来认识藏文笔迹特征,而应根据藏文的特点来分析和认识藏文的书写规律,研究其特征。  相似文献   

7.
文章就在藏文学习软件的知识上进行了一些学习,用Flash技术设计实现了藏文字母发音和书写的功能,基于Macromedia Flash 8或者Adobe Flash CS6等版本较高的软件下实现藏文字母的正常显示。采用Flash技术的动画制作和应用开发技术相结合,实现藏文元音字母和辅音字母的发音和书写功能的一种学习软件。此软件向藏文初学者在学习藏文字母过程中提供一个系统性的辅助,通过对藏文字母的读法(卫藏语)与书写(以"乌金体"字体)的学习辅助,从而能够快速提升学习藏文的效率。  相似文献   

8.
音节判定是藏文字典排序的基础。建立了基于Unicode编码的现代藏文音节结构判定算法。针对受语法影响的现代藏文音节进行预处理,使其满足一般现代藏文音节的结构;对含有占位辅音和含有不占位辅音两种情况分别进行判定。本算法能正确地判断所有藏文音节的结构。  相似文献   

9.
通过对当前流行的各种识别技术进行分析比较,在对藏文手写体特征展开深入研究的基础上,考虑到将来的研究趋势及可扩展性,提出了一套基于手写藏文识别的技术方法,即基于GA—BP神经网络的藏文识别方案,并着重对手写藏文识别中的特征提取和分类器设计进行了分析,提出了藏文识别领域今后的发展方向。  相似文献   

10.
随着互联网不断发展,境外反动势力利用网络传播不良信息呈愈演愈烈之势,尤其在藏文信息方面。利用最大熵模型,可对网络藏文文本进行分类,识别不良藏文文本及正常藏文文本。用互信息进行特征提取,建立藏文不良文本库用以训练最大熵模型,利用Opennlp最大熵工具包实现功能,利用最大熵模型求出文档属于不良文本和合法文本的概率,通过分析准确率、召回率对识别结果进行分析。通过实验实现了最大熵算法进行藏文文本分类功能,用最大熵算法进行藏文不良文本识别效果比较明显。  相似文献   

11.
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类、自动摘要、自动校对等等研究的基础工作。藏文自动分词中歧义消除也是关键技术,本文提出了藏文交集型歧义的切分方法即双向扫描识别和最大概率分词算法进行处理的方法。  相似文献   

12.
虽然现代藏文自动校对技术研究是藏文信息处理技术中一项具有广阔前景和极具挑战性的研究课题,但目前对藏文自动校对技术的研究主要是集中在自动侦错上,对自动纠错的研究要滞后得多,鲜见有专门的研究。文章主要对国内开展藏文自动校对研究的相关工作进行了介绍和评价,在此基础上对现代藏文自动校对的进一步发展进行了展望。  相似文献   

13.
文章基于现有藏文文献管理平台的功能模式,综合考虑用户关注兴趣以及主题内容的关联性,在参考中外文文献资源推荐算法的基础上,结合藏文文献的特点和藏文文献用户的关注兴趣,提出一种融合用户特征和主题关联的藏文文献自动推荐方法,该方法针对用户检索浏览数据和藏文文章特征建立主题模型,获取用户特征和关注主题;再依据关注领域核心作者信息,利用作者信息匹配和关注主题内容的关联判断实现藏文文献的主动推荐呈现。最后以部分藏文期刊文献数据作为测试数据对算法进行了测试实验,实验结果表明该方法具有一定的可行性。  相似文献   

14.
德萨 《西藏科技》2014,(9):77-80
现今的民族地区图书馆或收藏藏文文献的机构,若想顺应信息化、数字化、网络化时代发展的步伐,与时俱进,谋求发展,使藏文文献资源的建设、管理、利用尽快实现信息化,就必须依靠特色数据库及特色服务、将藏文文献相关数据建立产权属于自己的数据库,它是网络化时代藏文文献资源共享的基础。鉴于目前藏文文献数据库建设中存在诸多问题的现状,对藏文文献数据库建设与调查研究就显得尤为重要。文章通过对国内外藏文文献数据库建设的理论与实践研究现状进行概括性述评,阐述藏文文献数据库建设实证调查研究的必要性及其价值与意义,以期为藏文文献数据库的建设与研究者提供参考。  相似文献   

15.
德萨 《西藏科技》2014,(4):29-31
文章概述了2005~2013年国内藏文数字图书馆研究的进展及热点,从其藏文数字图书馆的概念、特点及各种技术在藏文数字图书馆中的应用、元数据研究成果,做一梳理并进行分析综合,以便揭示藏文数字图书馆的研究现状、研究重点和研究方向,为今后的研究者以启示。  相似文献   

16.
董晓芳  曹晖  江涛 《科技风》2012,(17):60-61
本文针对藏文词法及句法的特点,借助开源统计机器翻译平台,搭建起基于短语的藏汉统计机器翻译系统,重点描述了系统中的藏文编码转换和藏文自动分词的实现方法.最后采用500句新闻领域藏文语料对翻译系统进行测试,取得了 Bleu值为0.3425的较好结果.  相似文献   

17.
藏语文信息监测与发布关键技术难点主要包括网络爬虫算法设计、藏文自动分词及词性标注和藏文命名实体识别。文章围绕以上三个方面分别探索了网络爬虫技术、藏文自动分词及词性标注规则算法和藏文命名实体识别构思,致力于形成与舆情、安全相关的藏语文信息监测技术方案。  相似文献   

18.
藏文被称作“写在世界屋脊上的文字”,创始于吐蕃王朝立国之君松赞干布时期,记载和传承着藏民族悠久的文化,是世界上最古老的文字之一,也是藏民族至今最基本的交流工具。随着信息化时代的到来,藏文电子化成为必然需求。为了传承、保护、发展民族优秀文化,西藏大学依托计算机应用技术和藏语言文学两个自治区重点学科,于2006年成立了藏文信息技术研究中心,2007年被批准为“藏文信息技术教育部工程研究中心”,2011年被批准为“藏文信息技术国家地方联合工程研究中心”。在西藏大学藏文信息技术研究中心全体研究人员的努力下,这种古老文字正焕发着全新的生命力。  相似文献   

19.
马凌云 《现代情报》2014,34(10):74-78
本文通过对藏文古籍文献的分类和特点的分析,探讨了藏文文献的收集与开发的方法和途径,以期在网络环境下更大限度的发挥藏文文献的学术价值和社会意义.为促进我国的藏学研究事业和民族教育事业,提供一定的借鉴和参考.  相似文献   

20.
孙力 《情报杂志》2006,25(7):143-144,F0003
论述了开发建设藏文古籍文献数据库的重要意义,提出了建设藏文古籍文献数据库涉及的标准问题和数据库系统的结构,并指出了藏文古籍文献数据库系统建设过程中可能存在的一些问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号