首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
词性标注是语言研究者进行句法分析和其他研究的基础,其划分是否得当直接影响着语料库的下一步建设。本文从句法分析实际操作的角度对国内几个常用分词系统的词性标记问题进行了对比分析,着重探讨了其中一些标记给句法标注带来的问题,如习用语和简称、前接成分和后接成分。针对这些问题,本文从实用的角度,在参考多方建议的基础上,提出了相应的标注策略。  相似文献   

2.
在系统功能语言学小句理论的基础上,通过对5021个经过自动句法分析的句子的主语、谓语、状语、补语、补语1/2/3、补语剩余部分和谓语剩余部分的识别错误进行了数据统计和分析。共得出3类一级错误、7类二级错误和38类三级错误,并且将错误成因细致分为4大类13小类,配有具体实例说明。对面向自然语言处理的功能句法分析和语料标注均有一定的实际意义。  相似文献   

3.
树库是一种带句法标注的语料库,它记录着真实文本中每个句子的句法分析结果——句法树。上世纪90年代,自然语言的自动句法分析再次成为国际计算语言学界关注的焦点,一个重要原因是美国宾州树库PTB的建成。根据树库自动归纳出来的概率型上下文无关语法,使英语的句法分析器在性能上显著超越了先前基于规则和合一运算的句法分析器。世界上为各种自然语言构建的树库,不论是短语结构树库还是依存结构树库,都以句子为基本的描述单位。依存语法是一种词例化语法,它不采用短语结构的语法概念,而直接描写句子中词与词之间的依存关系,即认为句子中任何两个具有依存关系的词中必有一个是中心词(支配词),而另一个是被支配词。因此,依存语法直接体现了一种语言的句法层面和语义层面之间的天然联系。这充分说明,黎锦熙先生在《新著国语文法》中倡导的句本位语法体系和中心词分析法具有鲜活的生命力。它们不仅在我国解放前后的中学语文教学中数十年长盛不衰,而且至今仍在指导着树库的建设和应用。  相似文献   

4.
话语标记是处于句子之外表达程序意义、能对话语的理解起到引导作用的词、短语和习惯表达式。它们形式多样,功能复杂,多存在歧义而影响句法分析的效果。随着蒙古语语料库建设进入句法—语义分析阶段,话语标记研究为自动标注和消除歧义提供了丰富的语言知识资源。  相似文献   

5.
COLSEC的转写与标注对口语语料库建设的启示   总被引:2,自引:0,他引:2  
王芳  王晔  李文中 《天中学刊》2005,20(5):100-101
信息交流是受诸因素影响而进行的互动式交流,因而在口语中会不可避免地存在大量的不完整语句、停顿、打断、错误、修补等。COLSEC在建库过程中对语料的转写和标注方式进行了规范,从而保证了转写的顺利进行。COLSEC对学生的语音错误从重音错误、加音、减音和错音四个方面进行了全程标注。  相似文献   

6.
词性标注问题一直是计算语言学中的一个难点问题,对于一些词类的标注标准和方法,至今仍未统一,如兼类词、区别词,这给进一步的句法分析和语料库的共享带来了很大困难,甚至有时候会造成资源的浪费。本着实用的目的,在参考各家标注策略的基础上,本文对兼类词、区别词和状态词的标注给出了统一的标注策略。  相似文献   

7.
本提出了一种基于规则的汉语句法分析方法.通过对已进行分词与词性标注的句子进行短语的人工标注.形成精确度较高的语料.然后提取一些规则.分析出短语的结构和功能类型,为自然语言的计算机处理提供基础研究服务.  相似文献   

8.
介绍了当前句法分析的研究现状,利用《知网-中文信息结构库》作为知识库,结合当前汉语句法分析中的组块分析方法,提出了一种基于《知网》知识库的汉语组块体系。  相似文献   

9.
基于条件随机场的语义角色标注   总被引:2,自引:0,他引:2  
由于语义角色标注对深层次的自然语言处理非常必要,提出了一种基于条件随机场的语义角色标注方法.该方法以浅层句法分析为基础,把短语或命名实体作为标注的基本单元,将条件随机场模型用于句子中谓词的语义角色标注.该方法的关键在于模型的参数估计和特征选择.具体应用中采用L-BFGS算法学习模型参数,并选择基于句法成分的、基于谓词的、句法成分-谓词关系三类特征作为模型特征集.在CoNLL-2005评测任务所提供的数据集上的实验结果表明:基于条件随机场的方法比基于最大熵模型的方法性能更好.该方法在语义角色标注任务上获得了80.43%的准确率和63.55%的召回率.  相似文献   

10.
本文提出在使用基于范例的方法进行汉语短语标注过程中范例库的建立过程。标注中使用上海师大短语的标准标注集,采用分层标注的思想进行标注。根据人工标注的语料建立范例库,通过归并相似性公式进行计算,可以把小于某一阈值的不同范例归并为同一范例。  相似文献   

11.
Purposes of the present study included describing a variety of error recovery patterns based on eye movement (EM) measures of sentence parsing across reading level and error type. A qualitative pattern analysis of EM mappings was completed for students with reading disabilities (n = 10) and nondisabled students (n = 10) who were parsing control and erred sentences. Independent variables included error type (syntactically ambiguous, semantically anomalous, and control sentences) and reading proficiency level. Dependent variables consisted of seven eye movement measures. Chi-square analyses were performed to examine group differences across frequencies per pattern. Results suggest that the error recovery strategies deployed by both groups were similar in pattern and frequency; patterns were largely organized, strategic, and efficient, as predicted. Evidence for seven newly defined strategies was found, with indications of multiple strategies within sentences by both groups. Strategies tended to be error "reanalysis" (vs. "recovery") heuristics, in that readers from both groups used regressions to reanalyze regions of inconsistency rather than regions of disambiguation. Earlier conclusions regarding disorganized processing and individual differences among adolescents with reading disabilities are discussed.  相似文献   

12.
通过实验选择微库仑测氯仪的最佳使用条件,转化率达到85%以上,测得样品的标准偏差为0.48,相对标准偏差为2.03%。该分析条件的优化使用,缩短了分析时间,提高了工作效率及对工艺生产指导的及时性。  相似文献   

13.
Android平台上应用程序访问Web服务时,多数都会使用XML的解析技术.文中从工作原理、常用接口及类方法,XML文档解析的过程三个方面,分析比较Android所支持的三种解析技术:DOM、SAX、XML Pull.指出Android平台上选用何种解析技术主要取决于三方面的因素:移动设备内存的大小、XML解析文档的大小,以及移动应用程序中解析文档的主要用途.  相似文献   

14.
语结与英汉同声传译断句   总被引:1,自引:0,他引:1  
断句是是同声传译最重要的技巧之一。结合语结理论,对布什2006年国情咨文英汉同声传译(有删节)的断句进行的个案研究,通过仔细对比原文和译文,分析断句单位的构成,证实了英汉同声传译的断句单位与英语语结之间存在较高的相关性,即绝大部分的断句单位就是英语语结。  相似文献   

15.
语篇关系作为衔接机制对语篇结构的完整性与连贯性起重要作用,以语料库语言学方法,收集大学英语四六级作文素材组成小型封闭生语料库,然后利用RST工具标注作文语篇结构组建RST语篇树库,基于树库的数据驱动学习提出中国英语学习者偏好使用的语篇关系集合及相关触发语的选用特征,结论是语篇关系的正误使用与作文分数等级呈正负相关的线性关系。  相似文献   

16.
构造大规模文法的LR分析表是非常耗时的,本文对SLR(1)分析表进行讨论,给出了在构造SLR(1)分析表过程中的几种优化方法.  相似文献   

17.
汉语句法分析在自然语言处理中已经得到广泛的研究,而动词短语是句法分析中的重要内容,所以对动词短语的识别是非常必要的。本文首先定义了述宾动词短语,利用规则对述宾动词短语进行了自动识别实验,实验结果达到了较高的精确率,表明规则是可靠的。  相似文献   

18.
INTRODUCTION tic in-betweening techniques have been proposed during the past 30 years (for a comprehensive review of automatic in-betweening methods, please refer to (Yu and Patterson, 1997; Gotsman and Surazhsky, 2001)), their use in computer aided systems is some- how limited to dealing with local movements only (Yu and Patterson, 1997), because exaggerated drawings used in cartoon animations follow animation princi- ples and do not respect the geometry (Patterson and Willis, 1994) tha…  相似文献   

19.
关系词语对计算机的汉语复句层次关系识别具有重要意义。伪关系词的出现和关系标记的缺失给复句层次关系识别造成的影响,分析复句关系词语与同形的异类词、异构词之间的区别,揭示关系标记与词间连词、篇章关系词的不同用法的差异,挖掘复句关系标记缺失的隐现形式,以期为复句层次关系识别服务。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号