首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 234 毫秒
1.
在汉语框架网(CFN)的基础上,介绍语义角色自动标注的步骤和流程,提出基于文本匹配和最大熵分类器的语义角色自动标注方法。在文本匹配算法中,综合考虑短语类型、短语相对于目标词位置、句法功能三个因素及其对句子相似度影响的权重;在最大熵算法中,也尝试一些新的特征及其组合,最后利用例子对该方法进行有效性验证。  相似文献   

2.
[目的/意义] 研究统一医学语言系统中语义网络与社会化标注系统结合的深层次应用。[方法/过程] 总结UMLS语义网络的现有应用,分析UMLS语义类型与FrameNet语义类型的特征,构建适合本研究的语义类型,并通过实例梳理社会化标注系统与本体映射的思路。[结果/结论] 提出将所构建的语义类型作为标签归类的分类器以及作为分众分类系统与框架网络本体映射的桥梁。突破传统的基于统计的标签归类方法可为本体与分众分类系统的映射提供新的视角。  相似文献   

3.
计算机自动语义分析是当前制约自然语言信息检索、信息抽取与机器翻译等应用技术发展的一个瓶颈问题.语义角色标注是语义分析的一种主要实现方式,而目前语义角色的自动标注主要采用基于统计的方法,由于训练数据的规模有限、语义角色类型多,面临严重的数据稀疏问题,处理结果一致性差.本文则采取基于规则的方法,选择汉语框架语义知识库(CFN)所提供的框架和框架元素作为语义标注体系,利用CFN的语义标注句子库,根据短语类型、句法功能以及短语内部构成和外部语境等其他句法语义特征分析框架元素的实现规律,构建语义标注规则,经测试取得了令人满意的结果,为解决语义分析问题探索了一条可行的路线.  相似文献   

4.
基于角色关联的叙事型文化遗产知识表示方法   总被引:1,自引:0,他引:1  
[目的/意义] 叙事型文化遗产具有丰富的隐含知识与语义信息,仅采用图像、文字等数字化形式难以描述故事元素间复杂的关联与模糊语义,因此探究叙事型文化遗产的有效组织与表示具有重大研究意义。[方法/过程] 围绕叙事型文化遗产,利用语义数据模型提出基于角色关联的知识表示方式,构建具有多粒度、多角度且语义流畅的知识表示框架。此方法选取故事中的主要元素作为知识因子,通过聚集与特化的抽象关联关系表示知识因子间的角色关联,形成自然的图结构。[结果/结论] 基于角色关联的知识表示方式具有语义自然、可扩展性强、支持多样化检索等优势,可解决现有知识表示方法存在的角色缺乏情境依赖与表示角度单一问题。  相似文献   

5.
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。  相似文献   

6.
中文叙词表的语义化转换   总被引:1,自引:0,他引:1  
欧石燕 《图书情报工作》2015,59(16):110-118
[目的/意义]随着语义网与关联数据的兴起与发展,采用SKOS语言对叙词表进行语义化描述成为主流,这为叙词表在网络上的发布、共享以及在网络环境下的应用提供新的契机。[方法/过程]以《汉语主题词表》为例,对中文叙词表的语义化表示、验证和关联数据发布进行探索。首先,制定基于SKOS、SKOS-XL和SKOS扩展的叙词表语义化表示方案, 实现对叙词表的无损语义描述, 开发基于N-Triples格式的词表语义化转换程序, 使大规模词表的语义化转换更加简单高效;其次,采用新兴的SPIN框架对语义化词表的完整性进行验证, 为SKOS词表的正确性与合法性提供保证;最后,采用“Jena TDB+Fuseki+Pubby”的组合将SKOS/RDF词表数据在网络上发布为关联数据,并开发词表关联数据检索界面。[结果/结论]实验结果表明,采用本文的方法能够实现整个《汉语主题词表》的高效语义化转换、验证与发布,促进中文叙词表在网络上的共享与应用。  相似文献   

7.
基于法律框架网络本体的信息检索研究   总被引:4,自引:0,他引:4  
贾君枝  邰杨芳 《情报学报》2007,26(4):561-566
利用框架语义学原理,参考美国加州大学伯克利分校的FrameNet工程,我们构建了法律框架网络本体,针对当前网络信息检索存在的查准率低等问题,探讨中文法律框架网络本体应用之下的语义检索的解决方案.在法律本体的支持下,既实现对用户的检索提问的语义理解,又实现对法律文本的语义预处理,以将查询对象与标引过的文本进行匹配,实现对它们的精确匹配,提高检索效率.  相似文献   

8.
语义网中重量级本体的设计   总被引:1,自引:0,他引:1  
通过对本体论中顶层本体、领域本体和任务本体的分析,结合语义网的应用实际,提出语义中重量级本体设计的基本概念、基本要求和基本关系;认为角色概念有丰富的语义描述能力,是重量级本体区别于轻量级本体的重要特征,并试图通过对角色概念的剖析,说明角色概念对语义约束的描述特征。  相似文献   

9.
文章首先对社会角色的定义和内涵进行了概述,然后分别从微观、中观和宏观三个层次上探讨了社会角色对于网络社区用户研究的价值和意义.在介绍了对社会角色认识误区的基础上,结合网络社区和用户行为的特点,分别构建了角色识别研究框架和角色关系识别研究框架,并对基本的研究方法进行了梳理.  相似文献   

10.
赵一鸣  尹嘉颖 《情报学报》2023,(10):1187-1198
共词网络是研究语言现象的重要方法,语义特征是词汇共现现象中重要的隐性知识,研究共现词之间的语义关系及特征,可以从语义视角改进共词网络的研究,并利用语义学知识为现有的共词分析方法赋能。本文提出了一种语义增强型的共词网络构建和分析方法,从共现特征、网络特征与语义特征3个维度丰富了共词网络节点和边的属性。通过实验构建了基于14万余篇新闻文本数据的语义增强型全文本共词网络,并重点对共现词对的语义特征进行分析,结合案例呈现了该方法在计算语言学研究和行业应用上的价值。本文从词间语义关系的视角,拓展了共词网络的构建和分析方法,描述了共现词汇的语义特征,证实了语义关系的非对称性和传递性,为语义关系的分类与推导提供了理论依据,在语义消歧、词义理解等方面具有应用价值。  相似文献   

11.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

12.
针对汉语框架网络本体(CFN)在词汇覆盖面及语义分析和推理中存在的不足,在充分分析其结构的基础上,通过将其与另外两大知识库WordNet和VerbNet的集成,以增强汉语框架网络本体的广度和深度,从而达到构建一个功能强大的汉语框架网络本体知识库的目的。  相似文献   

13.
近年来国外Folksonomy的改进研究进展   总被引:2,自引:0,他引:2  
针对分众分类这种信息组织方式的缺陷,从提取folksonomy标签之间的语义和增强folksonomy的语义关系两个方面总结国外近年来有关分众分类的改进研究。重点阐述增强分众分类语义的三个方面,即扩展folksonomy系统本身的语义关系、语义网增强folksonomy的语义和本体与分众分类的融合;希望通过对国外近年来folksonomy的改进研究,为我国进行相关研究和实践提供参考。  相似文献   

14.
自然语言语义分析研究进展   总被引:5,自引:0,他引:5  
按照自然语言的构成层次——词语、句子和篇章,分析各层次语义分析的内涵、现有的研究策略、理论依据及存在的主要方法,并对现存的两类主要研究策略进行对比分析.认为词语语义分析是指确定词语意义,衡量两个词之间的语义相似度或相关度;句子语义分析研究包含句义分析和句义相似度分析两方面;文本语义分析就是识别文本的意义、主题、类别等语义信息的过程.当前的自然语言语义分析主要存在两种主要的研究策略:基于知识或语义学规则的语义分析和基于统计学的语义分析.基于统计与规则相融合的语义分析方法是未来自然语言语义分析的主流方法,本体语义学是自然语言语义分析的重要基础.  相似文献   

15.
由于目前没有共享本体来描述语义网巾数据的语义,因此需要对不同系统之间的本体进行调和,构建本体映射模型。近两年来,研究人员在原有成果的基础上对本体映射进行了更加深入的研究,提出许多新的映射方法,如元模型、语义富集模型、自动映射模型、大规模本体映射模型、快速映射模型与语义资源协同和连接系统。探究这些映射方式和模型的优势与不足的目的在于为今后本体映射方法的研究提供借鉴。  相似文献   

16.
介绍本体作为知识工程领域的一种新方法被引入到汉英机器翻译的研究中,用来协助机器翻译中对自然语言语义的理解和计算;指出本体为源语言与目标语言的词汇提供中性化、形式化的表达,其概念语义网络为自然语言的歧义消除提供世界知识、语义空间,本体工具本身所具有的推理功能也使机器翻译的语义处理更为便捷,本体已逐渐成为语义处理的新的理论基础及工具。  相似文献   

17.
文章从提高科技文献检索质量的视角出发,提出基于本体的科技文献检索框架,就本体构建、文献语义空间、查询请求重构、检索过程等方面进行研究,并给出关键算法。指出本检索框架与现有研究相比,主要特征包括:基于规则自动生成文献资源的语义扩展模型;构造“特征词汇-文献-概念”三层子网结构的文献信息空间;引入用户兴趣模型,强调有关用户的这些知识将对新的检索策略的产生和发展产生影响。  相似文献   

18.
[目的/意义]文章对科技政策隐性扩散路径自组织方法进行研究,挖掘科技政策文本包含深层语义信息,将隐性知识显性化,为科研人员拓展和丰富政策扩散路径研究提供参考。[方法/过程]本文结合科技政策篇章文本的形式语义和内容语义两个方面对政策文本结构化处理和深度挖掘,对政策文本资源全解析,抽取科技政策文本中包含的特征,其中包括概念和关系自动获取与标引技术、网络表示学习,挖掘科技政策文本中的隐含结构信息,利用BiLSTM-CRF模型的深度学习方法实现概念的自动获取和自动标引关系。将得到多篇科技政策文本的概念和关系组成概念关系对的形式,借助于表示学习的方法发现每个节点稠密的向量表示。[结果/结论]通过实验验证,证明了本文借助隐性路径特征的科技政策扩散隐性路径自组织方法的有效性,在一定程度上拓展了政策研究的方法,为科研人员在政策扩散研究上提供了参考。  相似文献   

19.
[目的/意义]面对海量专利文献,如何使用户快速、精准地掌握知识,是优化专利服务的关键课题.中文专利文献中大量存在的零形回指现象,严重影响了知识的自动识别与提取,但由于专利文献零形回指识别与消解涉及到众多文本分析技术及特定资源建设,因此,目前尚未发现针对性研究.[方法/过程]在物性结构理论、语义角色及修辞结构关系理论的指导下,展开相关规则的研究,开发句法及语义角色标注工具和篇章标注工具两种工具,并构建了4个资源库:①"专利动词物性角色库",将专利的动词归纳为4类;②"专利知识论元结构库",用于自动标注专利动词物性角色及其论元结构;③"专利动词论元结构规则库",用于分析零形回指的先行语;④"零形回指修辞结构类型库",用于分析当零形回指搭配"功能角色"和"部件角色"的情况.[结果/结论]通过资源库的建设,得出5条消解规则.初步成果已成功应用于机械领域专利文献的自动处理工作.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号