首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 250 毫秒
1.
肖磊 《文教资料》2009,(18):204-207
本文分析了<左传>地名结构的特点,基于CRF模型,对<左传>地名进行自动识别,通过只用字符本身作为特征的分词词性一体化实验和增加部首特征等实验的对比,总结出适用于<左传>地名的自动识别方法,实验效果最好的识别正确率和召回率分别达到94.59%、94.84%.  相似文献   

2.
在中文信息处理领域,缩略语识别是研究中很重要的一个方面。针对缩略语词典资源稀少的现状,提出一种利用余弦相似度方法在生语料中自动抽取现代汉语缩略语的方法;可自动生成一部缩略语词典,实验取得较为理想的结果。  相似文献   

3.
英语基本名词短语识别是一种重要的基础性自然语言处理活动,其识别准确率与召回率直接影响其它相关自然语言处理活动效果。在分析、总结几种具有代表性基本名词短语识别方法的基础上,提出了一种新型识别方法,其核心是:把边界概率与N_Gram词性串规则相结合作为识别判断条件,以“假拟中心词”为起点,分别向左、向右识别出当前“假拟中心词”所在基本名词短语的左、右边界。实验证明,该方法的识别准确率为97.13%、召回率为98.75%,FB=1为 97.93%。  相似文献   

4.
未登录的人名、地名以及机构名的自动识别是中文信息处理中的一个难点,自动识别技术的突破对提高汉语自动切词和句法分析的准确性有很重要的作用。本文基于书面语的特点,在标点符号的启示下,提出一种新的形式化处理策略,即在现代汉语书面语中给人名、地名以及机构名加上专名号,以便于计算机识别,从而通过原始文本的书写改革从根本上彻底解决问题。如能实行,则能一举突破这一难点,召回率和准确率都将能达到100%,而且意义重大,影响深远。  相似文献   

5.
运用相关性理论,建立1200多万字的当代汉语政教类公文抽样语料库,在对语料库进行分词、标注等加工的基础上,对其中词语的二元相关性组合进行了抽样统计分析,以此为基础对双音节缩略语进行识别和抽取,获得了比较理想的结果,为缩略语的自动识别和公文自动理解提供了新的思路和方法。  相似文献   

6.
基于统计的关键词抽取方法忽略了词语的深层语义信息,而词汇链的关键词抽取方法能弥补这一缺陷,但词汇链的构造需要计算语义相似度,而语义相似度的计算需要知识库的支持,提出了一种综合考虑词汇链和互信息模型的关键词抽取算法。首先对文本进行预处理。借助词汇链和互信息模型来表达词语间语义关系,以及对未包含词及相关联度高而相似度值不理想的关键词识别。实验结果表明:在准确率和召回率方面.较基于统计的和基于词汇链的关键词抽取算法均有所提高。  相似文献   

7.
介绍了主观题自动批阅系统(简称AATS)知识库在整个系统中的角色及其功能需求;阐述了具体领域学科的知识特点,提出按学科功能模块分类的树状结构模式来组织知识库,并把义项作为知识库的基本组成单位,进而定义知识库义项的概念表达式为一个有序四重组;给出AATS知识库的XML文档的DTD文件。实验表明,AATS知识库的这种结构组织模式可使主观题自动批阅的准确率大大提高。  相似文献   

8.
采用统计方法来识别中文四字姓名。该方法将中文四字姓名的识别过程分为姓名候选和姓名求精两个阶段。采用二元隐马尔科夫模型从已经切分好的文本中候选姓名。利用边界规则对候选姓名进行求精。实验结果表明,该方法的召回率为82.9%,准确率为87.3%。  相似文献   

9.
利用计算机视觉技术和机器学习技术对学生课堂行为进行自动识别,是过程性评价的一种新方法,近年来逐渐引起了研究者的关注。文章以监控设备拍摄的实际课堂教学视频为数据源,采集、标注了学生课堂行为数据,提取了学生的人体骨架信息。在此基础上,文章采用Boosting算法和卷积神经网络算法,对基于这两类不同机器学习算法的5种模型进行了学生课堂行为自动识别准确率实验。实验结果表明,在学校教室这种识别比较困难的场景,基于人体骨架信息提取的学生课堂行为自动识别可以达到较高的精度,其中基于Boosting算法的XGBoost模型识别准确率最高。文章的研究推动了计算机视觉技术和机器学习技术的进一步应用,有助于解决学生课堂行为自动识别难题,并助力教师优化教学策略、提高教学效率。  相似文献   

10.
将人工智能技术用于监控和识别考场中考生的不当行为,可以减轻监考人员的压力,提高考试的有效性、公平性和严肃性。本研究提出考场不当行为自动识别方案设想,以YOLOv3算法为核心,使用模拟考试场景视频数据开展自动识别实验,对考场不当行为自动识别的可行性和可靠性进行了检验。结果表明,考场不当行为识别的准确率高、速度快,方案可行且可靠,识别效果达到应用要求,对推动我国考试管理的智能化发展具有重要意义。  相似文献   

11.
为了建立一个面向中文信息处理的现代汉语复句精加工语料库,我们必须进行非分旬语言片段的自动识别工作,目的是把这些语言片段排除在分旬层次分析的范围之外。这项工作建立在自动分词和词性标注的基础上,主要分三个阶段进行。  相似文献   

12.
缩略语是社会发展的产物,英语缩略语和汉语简略语已成为各自语言发展最快的语言现象,它们已渗透到社会的各个领域。正确、合理的使用它们会给工作带来便捷、高效,相反则会妨碍跨文化交流。如何把大量英语科技产品或术语缩略语中的字母词转化为汉语简略语,是翻译工作者面临的巨大挑战。文章试图从英语缩略语和汉语简略语的语义及构成对比入手.探讨英语缩略语和汉语简略语互译的一些方法。  相似文献   

13.
汉语的简称     
简称是由语言中比较长的说法通过缩略的方式而形成的简短说法。汉语的简称比英语复杂,有很多问题值得研究。本探讨了汉语简称的类型、构成原则,着重探讨汉语简称形成的内在机制和方法,并提出有待进一步深入研究的一些问题。  相似文献   

14.
现代汉语缩略词语是一个非常复杂的集合,可以根据其产生动机和生成过程等的差异,分为"用语的缩略"和"造词的缩略",前者因着眼于对已有相对固定语言形式的便捷使用而生,后者则是不与某一相对固定的原式严格对应的、利用缩略性构词材料构成的组合形式。二者的着眼点不同,对应物不同,产生机制和过程不同,在表义上也有差异。在这个二分的框架下,可以看到台湾"国语"缩略词语与普通话的明显差异:就用语缩略来说,是数字略语少、合称多、三音节词的简缩多;就造词缩略来看,则是固定词少而临时词多。  相似文献   

15.
缩略词是一种常见的语言现象。汉语缩略词的形成是以汉字为基础,借助其指示符号的特点和语义系统相联系,选取全称的代表语素或减缩相同语素或用数字概括来表达原词及原意;英语中的缩略词是用英语构词法中缩略法去产生的新词。由于缩略词大大缩短了读写的时间,而且又能传达原短语全部或主要的信息,符合人们交往中的"经济原则",因此,缩略词将在文化、政治、经济、科技,计算机等方面得到广泛的应用。  相似文献   

16.
英汉缩略语饱和度差异对比研究   总被引:2,自引:0,他引:2  
本文通过对英汉缩略语构成能力以及现实中发展、分布情况的对比分析,探讨英汉缩略语饱和度差异.文章认为,无论是从构词能力还是绝对数量的增长,以及抽样文本中缩略语相对数量的对比,都显示英语缩略语的拓展性要比汉语强,饱和度要比汉语高.文章还从不同层面分析英汉缩略语饱和度差异的内在原因,对正确使用汉语缩略语提出看法.  相似文献   

17.
现代汉语数词缩略语探析   总被引:1,自引:0,他引:1  
数词缩略语格式的简洁与有序导致其构成成分在结构上具有类化倾向,与其它形式的缩略语比较,现代汉语数词缩略语具有表意多样与信息密集的特点。  相似文献   

18.
由于受到触觉感知速度和灵敏性的限制,加之盲文自身结构的局限性,阅读速度慢是各国盲文的共同特点。通过简写方案,可以减少盲文表达的方数,间接提高盲文的阅读、书写速度。简写对汉语盲文还有特殊的意义,简写符形代表固定的汉字,可以有效的区分高频同音词。简写可以提高汉语盲文的精确性、简明性,是盲文从低级形态向高级形态过渡的必由之路,对发展盲人先进文化有积极的意义。英语盲文的改革是简写方案的改革,而不是基本方案的更迭,这非常值得汉语盲文改革借鉴。  相似文献   

19.
基于语义的主观题自动批改算法的设计   总被引:1,自引:0,他引:1  
主观题自动批改是网络作业管理系统的一个难点所在。利用中文信息处理的知识,在描述知网的基础上,提出了一种基于语义的主观题自动批改算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号