首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
构建大规模句法树库对于句法分析模型有重要意义。通过分析完全句法树库中的句法分析标注的错误标记,从两个角度进行探究,分别是单个句法分析标记错误和句法分析层次结构标注错误,利用基于规则和统计的理论,发现并自动修正不一致,结果表明一致性检验的准确率为87.6%,召回率为94.8%。  相似文献   

2.
随着现代汉语语法理论研究的深入和词典编纂理论的发展,词性的标注问题得到了普遍的关注,不少词典开始标注词性。其中,对于词典词性标注问题,争议多存在于动词、形容词、名词之间的兼类与转类问题上。本文首先回顾词典词性标注的历史,然后从语言事实与外语教学等角度说明动转名的词性标注的必要性。  相似文献   

3.
词性标注问题一直是计算语言学中的一个难点问题,对于一些词类的标注标准和方法,至今仍未统一,如兼类词、区别词,这给进一步的句法分析和语料库的共享带来了很大困难,甚至有时候会造成资源的浪费。本着实用的目的,在参考各家标注策略的基础上,本文对兼类词、区别词和状态词的标注给出了统一的标注策略。  相似文献   

4.
本文通过对十部对外汉语教材中生词词性标注现状展开分析考察,分析了现行教材进行词性标注的特点和做法,指出教材在词性标注方面存在的问题,如词性标注存在错误、词性标注的依据不明确等问题,讨论了特殊类别词汇的词性标注问题,如离合词、兼类词、属性词等如何标注词性以及词语和语言构式是否需要标注词性.最后提出了建立词性标注体系、优选标注语言符号等词性标注的原则和建议.  相似文献   

5.
本提出了一种基于规则的汉语句法分析方法.通过对已进行分词与词性标注的句子进行短语的人工标注.形成精确度较高的语料.然后提取一些规则.分析出短语的结构和功能类型,为自然语言的计算机处理提供基础研究服务.  相似文献   

6.
李海波 《现代语文》2010,(7):117-118
本文在对《老屋窗口》一文进行手工分词和词性标注的基础上,归纳总结了手工分词和词性标注存在的问题,为中文信息处理中的分词与词性标注提供一定的参考价值。  相似文献   

7.
本文从中文信息处理的角度来谈汉语人名的标注与拼写问题,也就是把汉语人名的标注与拼写这二者结合起来考虑,而不只是简单地谈汉语人名的词性标注或汉语人名的拼写.下面先谈汉语人名的标注问题,然后谈汉语人名的拼写问题.  相似文献   

8.
由于汉语词类问题的复杂性,辞书标注词性困难重重。《现代汉语词典》第5版在继承前版的基础上,增加了词性标注。但是,由于主客观因素的影响和制约,其词性标注难免还存在一些失当之处,主要有:一、词性标注不够准确;二、词性标注前后矛盾;三、兼类词词性标注不全面;四、同类词词性标注不一致。笔者抽取一些具体的词,对上述问题进行分析探讨,并提出自己的看法。  相似文献   

9.
词性标注是中文信息处理领域中的一个重要研究课题。本文首先介绍了隐马尔科夫模型的表示形式和需要解决的问题,然后论述了HMM模型参数估计的方法,并对运用Viterbi算法进行词性标注的基本原理进行了深入的研究。  相似文献   

10.
从现代汉语语文词典“词性标注”问题入手,以《现代汉语词典》和《现代汉语规范词典》的标注结果为主要研究对象,重点选取个别特殊成分讨论。主要探讨两个问题:一是词性标注的单位;一是“们”和“者”如何定性。标注词性首先要辨别词与非词。意义整体性和成分黏着性是词的两大显著特征。在现行的汉语语法体系框架内,“们”宜区分为词缀“们”和助词“们,”从而更全面地描写“们”的特点。“者”宜区分为词缀“者”和助词“者”。其中,“者”的助词用法仅在仿古语体中出现。  相似文献   

11.
笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模型在标注蒙古文词性方面都有比较好的结果,其中在考虑上下文和特征"连写的构形附加成分"的情况下,SVM模型标注蒙古文词性的准确率可以达到99%以上。  相似文献   

12.
对外汉语教材词性标注问题研究   总被引:1,自引:0,他引:1  
本文考察了发展汉语系列教材中的7部,指出了对外汉语教材词性标注的几个要注意的问题,以求教材词性标注更加科学化。  相似文献   

13.
王专 《语文知识》2012,(3):109-111
本文主要从部分属性词词目失收、属性词词性标注存在失误、个别词的义项遗漏了属性词标注、属性词兼类的标注问题四个方面对《现代汉语词典》(第五版)属性词标注失误进行了分析归纳,并据此进一步思考辞书编纂时应遵循的系统性原则。  相似文献   

14.
定中结构中"的"字的隐现问题一直是学界研究的热点和难点。对颜色词作定语时"的"字的隐现规律进行考察。从词性角度对颜色词进行分类,考察不同词性的颜色词作定语使用"的"的情况。从"的"的描写性标记功能分析"的"字隐现情况的原因,并从认知角度对其进行解释。  相似文献   

15.
词性自动标注是对语料在高层次上进行分析的一个重要组成部分,其结果可以用于很多自然语言处理应用程序当中。而维吾尔语和其它语言一样也存在词兼类现象。本文介绍了维吾尔语词性自动标注系统的设计思想和实现过程。该系统基于隐马尔科夫模型,采用Viterbi算法来进行词性自动标注。  相似文献   

16.
狭义“有”字句和方言“有”字句是有内在联系的,它们中的“有”都统一在表“存在”的本义下,分别表示事物、性状、事件的存在。“有”字的词性是动态的,根据后接成分从名词到名动词到谓词的不同,而呈现出一个由动词到准谓宾动词再到副词性确认标记的变化过程。  相似文献   

17.
第5版《现代汉语词典》在区分词与非词的基础上,对所收的词进行了词性标注,这是一件意义非凡的事情。但我们在仔细阅读该词典后,却发现了一些值得商榷的问题,如同类词词性标注不一致;词性标注不当;词性缺标;释义与词性不一致等。  相似文献   

18.
协同副词的语义指向多个名词性成分,协同副词对名词性成分的要求在句法上必须是复数的.形式有有标记的和无标记的两种,语义关系有主从式和并列式两种;同时协同副词对名词性成分的语义有规约作用,名词性成分必须是有界的,且内部关系存在一个连续统:从典型的语义场到某种语义的相关性再到语用场的渐变过程。  相似文献   

19.
针对传统的文本聚类容易受到噪声影响的问题,提出一个基于词性标注的文本聚类算法。该算法利用词性标注从文本中识别并抽取最能体现文本特征的关键词,再基于所抽取的关键词进行聚类操作。实验发现,相对传统的聚类算法,基于词性标注的文本聚类算法能够有效地提高聚类结果的质量。  相似文献   

20.
自然语言信息处理研究的核心问题是语言的自动理解和自动生成。随着自然语言处理各项底层技术如分词、词性标注、句法分析等不断的发展和逐渐成熟,为更深层的技术研究奠定了坚实的基础。目前,自然语言处理中的高级技术——语句改写受到众多研究人员的广泛关注,并将语句改写的一些成果应用到信息抽取、搜索引擎、机器翻译等多个领域。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号