首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 125 毫秒
1.
遥感影像具有数据量大、数据结构复杂、连续、存在缺损与误差等特点,根据遥感影像的特点,提出一种基于多代表特征树的CAMFT算法.该算法通过多代表点特征树把海量空间数据进行压缩来提高效率,并且可以捕捉复杂形状聚类;算法CAMFT融人了采样思想,进一步增强了处理大型数据的能力.实验结果表明,该方法聚类精度优于K-Mean算法.  相似文献   

2.
在分词工作常用数据结构模型的基础上,提出了字符串完全分词网络模型,讨论了该模型的基本性质,给出了其中的路径查找基本算法。该模型能反映中文分词问题自身的特点,便于分析分词问题中的统一性质。利用该模型将全切分图的生成、修改、路径查找等工作分解为统一平台上相对独立的过程,能较好地配合多种常用分词算法,简化对各种算法的研究和描述。该模型与自然语言理解后续工作使用的数据结构如句法树等也有很好的相似性。  相似文献   

3.
针对人工智能在信息搜索领域的实际应用,本文介绍了一种基于中文分词算法的英语学习资源查询系统。该系统通过一种基于中文分词算法的搜索策略,结合事例推理技术实现对英语学习资源的智能搜索。系统测试结果表明,用户可以通过该系统搜索到所提问问题的类似事例以及解决该问题的相关知识条款。  相似文献   

4.
在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开发基于该算法的自动分词系统,并探讨了开发过程的关键技术.实验表明,采用所述算法和技术的自动分词系统的准确率较高、分词速度较快.  相似文献   

5.
李畅  吴振强 《考试周刊》2011,(26):177-179
传统的算法处理分词过于粗糙,而且往往会引起分词歧义。为弥补传统分词算法的固有缺点,本文在吸收了成熟算法优点的基础上,提出了改良型的中文分词算法(正向扩词分词算法和反向扩词分词算法)。这两种新算法与传统最大匹配算法相结合,不但提高了分词的精度和速度,而且降低了分词服务程序的开发难度。经过实践验证,分词准确率达到大多数系统对中文分词的要求。  相似文献   

6.
介绍了聚类分析方法和BMP图像的数据结构,并在此基础上,设计实现了图像色彩自适应聚类算法,目的是在充分理解图像色彩控制原理和BMP格式的点阵图像数据结构的基础上,完成具有根据图像自身的色彩构成特征,实现图像色彩自适应聚类功能的应用程序。该算法简单有效,有很好的实用价值,值得推广和应用。  相似文献   

7.
企业积累了大量的客户消费数据,如何从大量的数据中发现用户的消费模式,对企业的营销策略具有重要的指导意义,数据挖掘技术正是可以从大量的数据中挖掘出对企业决策有价值的信息。针对客户数据的特点,提出一种基于Kruskal算法的最小生成树模糊聚类算法KTFC,并将其应用在客户关系管理中。实验证明,该模糊聚类算法可以有效地对企业客户群进行分类,并分析出每类客户的特点,动态地选取不同的λ值可以获得不同的聚类结果,大大地提高了聚类的灵活性。  相似文献   

8.
基于神经网络的人工智能分词是中文分词技术的一个重要发展方向。介绍了当前神经网络分词的研究现状,给出神经网络分词的一般模型,重点阐述BP等算法在歧义解决中的应用,介绍了BP算法在未登录词识别方面的应用,最后对分词技术的发展进行了展望。  相似文献   

9.
由于中文语言的复杂性,给中文分词系统带来了较大的困难,不论哪种分词系统都不能百分百的解决分词问题。针对目前中文分词存在的困难与问题,主要探讨了几种常见的中文分词算法及各自的优缺点。  相似文献   

10.
中文分词技术综述   总被引:2,自引:0,他引:2  
中文分词是中文信息处理的基础,分词系统也是中文信息处理中的一个主要组成部分,对中文文本的分词处理目前已经应用到了中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统等领域。本文对现有的中文分词技术进行了综述,分析了现有分词方法的技术特点,指出了部分分词方法存在的优缺点。  相似文献   

11.
现代汉语名词后缀"子"的用法探析   总被引:2,自引:0,他引:2  
文章主要考察"子"由实词演变为类化成分和后缀的过程,其最重要的语法性质是具有名词化的作用.在漫长的历史变迁中,汉语名词后缀"子"的使用范围逐渐扩大,到今天它已经成为一个组词能力非常强的名词后缀了.  相似文献   

12.
运用词组附加在词干上构成新词,是汉语方言的一种构词方法。东安石期土话中的词组“咑”可从类别、功能及与普通话词的对应三方面进行分析。类别上,“咑”尾可分为名词、动词、形容词及数量词词尾;双音节“咑”尾词与普通话词之间有六种对应关系;功能上,“咑”尾不仅是一个构词的后缀,而且它具有附加性的词汇意义及语法意义。  相似文献   

13.
借助于统计语言模型将汉语分词转换为字序列标注并实现汉语分词已经成为近年来汉语分词的主流方法,但统计语言模型训练时间较长一直是这一方法中的最大问题.提出了一种基于三词位的字标注汉语分词方法,并在bakeoff2005提供的语料上进行了对比实验,结果表明该方法可以取得接近四词位字标注分词方法的性能,但在模型的训练时间上明显优于四词位标注方法.  相似文献   

14.
徐时仪 《台州学院学报》2006,28(2):19-22,27
古文字字库建设与古文字研究手段现代化问题的提出可以说是古文字研究面临的一次新机遇和新挑战,也是古文字研究与当代信息社会相结合的一个重要标志。以“样”和“怕”为例,理想的古文字字库应载明字库中各字的本字本义,且应揭示古今用字之异与其所表词义及假借义的演变。汉字形音义衍变递嬗的古文字字库是数字化时代的必然产物,代表着古文字研究手段现代化的新趋势。  相似文献   

15.
汉语中的词究竟有没有词尾,这是一个有待妥善解决的问题。要甄别现代汉语词尾,必须有正确的甄别方法。甄别现代汉语词尾的正确方法是:处于词的后面位置上的虚语素,起到构成新词作用的为后缀,否则为词尾。"×子、×头、×儿、×们"中的"子、头、儿、们",若为处于词的后面位置上的虚语素,又没起构成新词的作用,是词尾,否则不是。"无词尾说"不正确。前人的"有词尾说"也不完善。只有找到词尾与后缀的本质差异,确立甄别现代汉语词尾的正确方法,才能对现代汉语中客观存在的词尾做出准确的甄别。  相似文献   

16.
《诗经》中“斯”有动词、代词、连词、语气词和词尾等多种词性及词义和语法功能。“名+斯”、“谓+斯”、“彼+谓+斯”结构的“斯”相当于指示代词“者”,“数+斯+名”结构的“斯”相当于指示代词“其”,“螽斯羽”等“斯”功能同连词“之”。因文字假借和语法演变,“斯”字被借作指示代词,指示代词进一步向连词、语气词和词尾发展。《诗经》中不同词性的“斯”分别和先秦汉语虚词“之”、“其”、“者”、“然”等异词同义。  相似文献   

17.
《分词规范》与《正词法》1在中文信息处理中有着同样重要作用,两者既有各自的侧重点又存在一些共性的,两者所规定的词均与"语法词"、"词汇词"存在着联系,但《正词法》规定的分词连写方式并不能够解决中文信息处理的分词问题,只有充分利用《正词法》的研究成果,再结合中文信息处理的特点,才能使《分词规范》更加完善,促进中文信息处理分词问题的解决。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号