首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
主题自动提取对于专利文献的信息挖掘具有重要的意义。引入语义角色标注信息来辅助自动提取专利文献主题,区别于已有的专利文本分析平台所采用的人工标注或模板方式。为了改善专利文献的语义角色标注,首先描述将专利文献长句自动拆分成简化句的方法;其次,对简化句进行语义角色标注;最后,综合利用简化句语义信息以及自建带语义框架的常用词表,对专利文献进行主题信息抽取,获得必要信息,从而证实本研究的实用价值。  相似文献   

2.
语义网的实现需要为网络上现有的和新的文档进行广泛可用的语义标注,使其内容可被机器所识别和理解。语义标注是清晰、明确、容易理解的,可作为大量应用的服务基础,适用于多种文本,包括网页、普通(非网络)文档、数据库中的文本等。本文根据语义标注的研究历程,介绍了国内外面向文本的语义标注研究现状,对语义标注所使用的技术进行总结;在已有语义标注方法分类的基础上,对现有的标注方法进行分类分析;指出了近年来语义标注方法的不足,并探讨了面向文本文档的语义标注发展趋势。  相似文献   

3.
数字图像语义标注模型比较与分析   总被引:1,自引:0,他引:1  
[目的/意义]图像语义标注的基础是图像语义标注模型的构建,对当前主流图像语义标注模型进行梳理和总结,剖析其在图像语义标注中的优缺点,可为后续相关研究提供借鉴和参考。[方法/过程]采用文献调研法,总结出4类主要的图像语义标注模型,即Eakins模型、Jaimes&Chang模型、Kong模型、Panofsky模型。其后采用比较法和归纳法,从语义层次、可扩展性以及应用范围和方式3个方面对前三类模型进行比较分析。[结果/结论]Eakins模型语义层次最全面,语义表达能力最强,应用范围最广;Kong模型的可扩展性最强,适应性最好。  相似文献   

4.
自动图像标注技术是图像检索技术的最新发展,已经成为机器学习、图像语义理解和信息检索研究领域的热点.本文对自动图像标注目前国内外的研究概貌进行了分析,按照自动图像标注中的关键要点--语义学习的不同,将现有文献中的自动图像标注技术分为三个类别,并对这三个类别分别进行描述,同时总结了自动图像标注派生出的两个新的研究方向.最后对目前研究中存在的问题进行了讨论,并探讨了自动图像标注领域的进一步研究方向.  相似文献   

5.
[目的/意义] 针对本文作者为了对敦煌壁画图像蕴含的信息进行语义描述、揭示与标注而提出的层次性图像语义描述框架(SDFDI),采用内容分析法验证其合理性。[方法/过程] 以中国知网、维普数据库和万方数据库中的237篇敦煌壁画图像研究文献为样本,借助人工编码,统计非语义A类信息、基本语义B类和C类信息、复杂语义D类信息的分布情况以及其与SDFDI框架的匹配率。[结果/结论] 统计结果显示,在敦煌壁画研究文献中,这4类信息呈现正态分布,匹配率也说明SDFDI框架可以作为图像深度语义标注的参照基准。  相似文献   

6.
面向科技文献的混合语义信息抽取方法研究   总被引:1,自引:0,他引:1  
针对目前知识抽取技术无法精确抽取学术文献中提及的具体理论方法和性能指标参数等问题,综合运用语义标注技术、规则抽取技术以及正则表达式技术,提出一种面向科技文献的混合语义信息抽取方法。该方法首先对科技文献进行语义标注,得到相关学术术语。然后,构造抽取规则,抽取文献提及的与具体性能指标相关的句子。最后,采用正则表达式技术从相关句子中精确抽取出关键性能指标。对碳纳米管研究领域科技文献语义的信息抽取证明,该方法能迅速、有效和准确地抽取科技文献主要创新研究内容和性能指标。  相似文献   

7.
利用语义角色标注技术对文献进行标注,以句子为最小单位进行文献的语义相似度检测。提取文献中所有词语的上位词,为每篇文献形成句子-词-语义角色-上位词四部图。语义相似的句子对比参照四部图确定,最终计算出两篇文献相似句子的Jaccard系数作为两篇文献的语义相似度。实验结果表明,所识别出的语义相似度较字粒度Jaccard系数法、词粒度Jaccard系数法、Winnowing Jaccard系数法等高出13%,然而受语料库限制,本方法还有很大的提升空间。  相似文献   

8.
董慧  余传明  姜赢  杨宁  徐国虎  张华 《情报学报》2006,25(4):451-461
语义信息提取是一项较新的技术,本文讨论语义信息提取的定义、原理和思路,并以国共两党关系历史为领域背景,详细分析语义信息提取的过程,即对于待处理的自然语言文字,将其进行分段和分句;针对拆分出的句子,进行分词和词性标注;在词性标注的基础上选择适当动词作为句子的语义谓词;判断该谓词是否属于语义谓词列表;再根据语义谓词来获取相关的语义实体,同时对于指示代词进行消解;最后对时间和地点维进行提取,并更新语义提取背景。本文还对开发过程中所用到的数据结构、关键算法进行了分析。  相似文献   

9.
2007-2008年国外语义Web研究进展   总被引:2,自引:0,他引:2  
2007-2008年国外语义Web的研究重点主要放在语义标注、语义推理、语义搜索引擎和语义Web服务4个方面,并且呈现出以下特点:语义Web在虚拟知识环境中针对性研究居多,综合性应用较少;实际应用主要集中在小范围的应用方面;研究成果以会议论文居多,期刊论文较少.  相似文献   

10.
在分析社会化标注系统标签检索研究现状基础上,针对传统方法可计算性不高、完备性不够、无法分辨自然语言的语义模糊性等不足,提出基于潜在语义分析的社会化标注系统标签语义检索模型,改进标签-资源矩阵权重计算算法,完善社会化标注系统的语义标注方法。并以delicious系统为例,抓取数据进行验证分析,通过对比,证明提出的模型和改进的算法能显著提高标签检索效率。  相似文献   

11.
计算机自动语义分析是当前制约自然语言信息检索、信息抽取与机器翻译等应用技术发展的一个瓶颈问题.语义角色标注是语义分析的一种主要实现方式,而目前语义角色的自动标注主要采用基于统计的方法,由于训练数据的规模有限、语义角色类型多,面临严重的数据稀疏问题,处理结果一致性差.本文则采取基于规则的方法,选择汉语框架语义知识库(CFN)所提供的框架和框架元素作为语义标注体系,利用CFN的语义标注句子库,根据短语类型、句法功能以及短语内部构成和外部语境等其他句法语义特征分析框架元素的实现规律,构建语义标注规则,经测试取得了令人满意的结果,为解决语义分析问题探索了一条可行的路线.  相似文献   

12.
基于共现分析的语义信息检索研究   总被引:1,自引:1,他引:0  
提高信息检索系统的用户体验度可以从查询优化的算法和增强可视化展示的研究等方面入手。本文利用文献调研、共现分析和构建本体等方法,设计基于共现分析的语义信息检索和流程,并利用武汉大学图书馆的书目检索系统中"世界考古"类目的数据进行实验分析。经过文献调研发现,目前语义信息检索主要集中在基于本体的查询技术、语义标注问题和语义关系检索等方面的研究,语义信息检索目前只能做到表层相关的检索。构建的基于共现分析的语义信息检索模型包括规范器、分析器和本体构建器三个部分,其中分析器是本模型的核心。经过实验分析发现共现分析可以应用于语义信息检索,并比较得出基于共现分析的语义检索比传统检索更具人性化、引导性。  相似文献   

13.
面向医学领域的语义互联模拟系统(MOSISS)是数字资源语义互联研究的实例支撑。语义标注子系统是MOSISS的重点子系统。在基于本体的语义标注思想指导下,阐述该子系统的设计思想、体系结构以及功能,探索多领域本体在语义标注中的应用,为用户提供一种共享数据的方式。  相似文献   

14.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

15.
在CNKI中国期刊全文数据库中选取2001—2010近10年间关于语义网的研究论文共736篇,用文献计量学的方法,结合内容分析法对这些论文进行分析。从近10年间论文量变化、论文的地区分布、论文作者的机构分布、作者分布、刊物分布等方面总结我国语义网应用研究的现状,并预测今后5年内语义网应用研究的趋势。  相似文献   

16.
数字图像的语义描述与标注是解决图像检索中语义鸿沟问题的关键。由于缺乏面向领域的有效的数字图像描述方法规范,基于图像底层视觉特征的机器标注和基于专家知识的人为标注的标注结果都存在标注信息质量不高和结果不统一的问题。针对这一现实问题,本文基于图像元数据和信息需求理论,针对敦煌壁画数字图像这一特定文化遗产领域,提出了语义描述框架和领域主题词表相结合的数字图像内容语义描述方法,详细阐述了语义层次及其相互关系。同时,从图像语义描述粒度的角度讨论了语义粒度大小对标注成本的影响,以及该语义描述框架的可移植性问题。图4。表5。参考文献25。  相似文献   

17.
[目的/意义] 由于传统科技创新主题概率识别方法忽略文本内容语义理解,为了更加准确地识别出主题,科技创新主题语义识别势在必行。[方法/过程] 提出一种基于LDA的科技创新主题语义识别方法,利用语义角色标注技术对科技文献中的科技创新内容进行语义标引,构建LDA主题语义识别模型,根据表征科技创新内容的关键词语义角色对应的上位词的概率识别出科技创新主题。[结果/结论] 通过以3D打印领域数据为对象进行实验,证明该方法能够更加准确地识别出科技创新主题,形成科技创新主题-主题词-科技文献的混合分布聚类集群,减少研究背景等无关数据干扰,避免语义含义相同的科技创新主题词重复统计问题。  相似文献   

18.
指出语义出版以其对文献知识内容的结构化发布与呈现成为备受关注的新兴出版模式,通过梳理学术期刊的语义出版实践,总结语义出版应用的发展现状,并在分析语义出版主要技术路线的基础上建立语义出版的技术框架;重点关注学术文献的语义建模问题,归纳代表性的应用模型,并对文献语义模型的未来发展趋势进行展望.  相似文献   

19.
[目的/意义] 随着科学交流体系向电子媒介迁移,传统的科学论文内容组织及呈现方式带来了诸多弊端。科学论文语义增强能够创新科学论文内容的组织与呈现方式,是解决这些问题的关键,得到了来自科研机构与学术出版商的重视,形成了一系列理论与实践成果。对这些成果进行梳理、归纳,发现其中的优势与不足,能够为后续推动科学论文语义增强的进一步发展起到指导作用。[方法/过程] 从语义增强的概念入手,着重分析科学论文语义增强的核心目标、实现路径与关键问题,随后,梳理对科学论文中正文本与副文本内容进行语义增强的理论与实践成果,并围绕科学论文语义增强路径上的三个阶段:语义标注、语义组织与可视化呈现进行对比分析。[结果/结论] 研究进一步归纳总结现阶段科学论文语义增强的特点,并对科学论文语义增强的未来发展及研究提出4点意见。  相似文献   

20.
大众标注系统中基于本体的语义检索研究综述   总被引:1,自引:0,他引:1  
针对大众标注系统中由于用户添加标签的多样性和模糊性导致的检索准确性问题,建立基于本体的大众标注系统语义检索模型,分析需要解决的关键问题,如基于社会化标签建立系统专用的本体和利用构建的本体实现语义检索,据此详细分类并阐述当前研究,并对未来研究进行展望。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号