首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
概念等级关系自动识别研究   总被引:1,自引:0,他引:1  
界定了信息检索用概念等级关系的涵义,明确了其包含的属种、实例和整部三种子关系类型并阐明概念等级关系自动识别研究在信息组织和信息检索领域的五种应用途径,详细介绍了常见的概念等级关系自动识别方法,包括基于同现统计的识别方法、基于句法模式匹配的识别方法、分布相似度计算方法、基于在线维基百科篇章结构的识别方法、基于词典定义的识别方法,并分析它们的优点和不足之处.最后建议中文等级关系的自动识别,可以借鉴以上方法,利用中文现有语料如<同义词词林>和汉语构词特点,综合使用多种方法以取得等级关系识别的最佳效果.  相似文献   

2.
在对当前术语语义相似度集成相关研究进行分析的基础上,针对典型集成方法存在的不足,构建了基于多种测度的术语相似度集成计算模型.首先对集成计算模型的设计思路进行论述;其次提出了在模型中应用的相似度网络初始化算法、术语语词相似度改进算法、术语语境模板相似度改进算法以及基于搜索引擎的术语相似度改进算法,并实现了该集成计算模型;最后对该模型中所使用的各种相似度测度计算性能指标以及完全计算SVM集成和条件计算SVM集成性能指标进行对比评测.实验证明,该计算模型的F1综合性能达到0.8797,并能缩短32%的计算时间,有效提升了术语相似度综合计算性能.  相似文献   

3.
针对现有基于语词的术语相似度典型算法存在的问题,提出了将WordNet和编辑距离计算应用于术语词语匹配过程,并根据术语修饰词的位置赋予特征权重的术语相似度改进算法.和已有算法相比,新的算法在三个方面有所改进.首先,在术语中心词匹配过程中引入WordNet的同义词、近义词检索功能,实现中心词之间的语义匹配;其次,将术语词语的直接匹配改进为基于编辑距离计算的模糊匹配;最后,在计算过程中充分考虑了术语修饰词与中心词之间的距离对修饰词权重分配的影响因素.针对新算法提出了具体的实现步骤,并选取基因工程领域实验数据对改进算法和现有典型算法进行对比评测.实验证明,每种改进方法在单独测试时效果优于或至少不低于Nenadic算法.基于三种改进方法的综合计算方法在计算效果方面具有明显提升.  相似文献   

4.
李毅  庞景安 《情报学报》2003,22(4):403-411
为了提高中文医学信息检索效率,本文应用语义学研究成果,深入剖析统一医学语言系统(UMLS),从理论上对多层次概念语义网络结构进行了探讨,以此设计了适用于中文医学信息特点的三层概念语义网络结构,并分别确定了各个概念语义网络层次的语义类型和语义关系,进一步完善了医学信息语义网络.以信息检索的认知理论为依据,建立了基于三层概念语义网络结构的中文医学信息语义标引体系和语义检索模型.对扩展检索和语义检索进行统计学Kappa检验,认为两种检索方法的一致性非常显著(p<0.01);与扩展检索中的任何一种方法相比,语义检索方法具有更高的检索效率.  相似文献   

5.
基于潜语义标引的自然语言检索   总被引:3,自引:0,他引:3  
在信息检索中, 向量空间模型是最有效的数学工具之一。由于自然语言检索的特殊性, 以及传统信息检索模型受到同义词、多义词的影响, 检索的查准率不高。为了提高自然语言检索的查准率, 我们对基于概念的信息检索模型——
潜语义标引(LS I) 模型进行了探讨, 并分析了基于LS I 的两个实例。  相似文献   

6.
面向信息检索的术语服务构建与应用研究   总被引:1,自引:0,他引:1  
在信息检索中,叙词表作为一种辅助有效检索的工具变得日益重要。术语注册与术语服务是在网络环境下对叙词表进行维护和应用的一种理想方式,能够极大促进叙词表在信息检索中的应用。本文的研究重点是面向信息检索的术语服务构建与应用。首先,以《汉语主题词表》为来源词表,采用语义网技术和REST架构构建术语服务。其次,以“获取同义词”服务为例,对术语服务在图书馆OPAC系统和百度搜索引擎中的有用性进行测评,结果表明,采用这一服务使OPAC系统的F值提高13%,使百度搜索引擎的P@5查准率提高16%。最后,设计了四种术语服务在信息检索系统中的应用方式,即复选扩检式、单选替换式、混合式和自动扩检式,并采用用户测评法对这四种应用方式进行可用性测评,结果表明,复选扩检式是可用性最佳的术语服务应用方式。图13。表9。参考文献34。  相似文献   

7.
针对传统信息检索模型不能很好满足用户需求的问题,在分析现有相关研究的基础上,提出基于领域Ontology的知识检索模型。通过构建领域Ontology,对文档进行语义标注,对查询请求进行概念提取和语义扩展,从而得到语义索引项作为文档和用户请求的知识表达,进一步研究领域Ontology中词语间语义关系的计算模型。考虑到语义相似度与语义相关的内在关系,给出相关系数来衡量检索目标与候选者间符合程度。最后对提出的模型进行验证,结果表明检索性能有显著提高。  相似文献   

8.
基于领域本体的专利信息检索系统研究与实现   总被引:1,自引:0,他引:1  
 针对传统信息检索方法在当今网络信息环境下所面临的问题,提出基于领域本体的专利信息检索模型,从用户检索请求处理、本体构建、本体可视化与语义扩展、检索及存储的过程和技术实现进行研究,并开发一个基于服装领域本体的专利信息检索原型系统。比较测试表明,该模型在确保信息检索准确性的同时能够极大地提高其全面性。  相似文献   

9.
电子文档和用户的增长导致了信息检索结果个性化模式的创新,从而更好地为用户偏好服务.个性化的内容检索旨在改善检索过程中考虑个别用户的特殊兴趣.本文提出了一种基于扩展模糊概念网的信息检索结果的个性化的新方法.在这种方法中,网页和用户偏好都将以扩展模糊概念网形式表示.扩展模糊概念网可看作是关系矩阵和关联矩阵模型,关系矩阵中的元素代表模糊概念间的关系,关联矩阵中的元素表明概念间的关联度.这种方法的好处是能找到用户查询的绝大多数文档并且更灵活、更好地显示给用户.  相似文献   

10.
传统的网络信息检索存在很多缺陷,导致检索效率低下。本文提出了一种基于本体论的个性化网络信息检索的模型。该模型的实现可以在一定程度上缓解Internet网上信息过载的问题,提供用户个性化信息检索服务,提高网络信息检索的准确率。  相似文献   

11.
提出一种利用翻译词对信息快速构建知识组织系统中术语之间同义关系的方法:利用单词条的翻译数量、翻译共现强度等作为基本输入,通过简单布尔判断、条件互信息或向量空间模型余弦相似度来计算术语之间的相似度,进而发现并构建同义关系;采用准确率和丰富率来评价构建效果,通过在新能源汽车领域进行实验,发现该方法不但速度快,而且在翻译信息比较丰富的条件下,对于中文同义关系构建有较好效果。  相似文献   

12.
基于语义网计算英语词语相似度   总被引:14,自引:2,他引:14  
荀恩东  颜伟 《情报学报》2006,25(1):43-48
本文介绍一种基于WordNet的计算英语词语相似度的实现方法:从WordNet中提取同义词并采取向量空间方法计算英语词语的相似度。向量包括三方面:(1)WordNet的同义词词集(Synset),(2)类属信息(Class),(3)意义解释(Sense explanation)。实验结果表明,这是计算英语词语相似度的一种可行的方法。  相似文献   

13.
刘伟 《图书情报工作》2015,59(12):128-134
[目的/意义] 鉴于目前同义词抽取方法无法避免抽取结果含有较多的噪音,需要较高的人工代价去除噪音,提出一种对同义词抽取结果排序的方法,使得正确结果排序提前,以达到提高抽取结果准确性及降低人工去噪代价的目的。[方法/过程] 将抽取结果转化为抽取关系有向图,基于该有向图计算抽取结果中每个词汇与被抽取词汇的词义相似性,并按照词义相似性高低进行排序。排序方法的最大特点是只利用了当前的同义词抽取方法,不需要人工参与和额外的语义知识。[结果/结论] 通过在真实数据集上进行验证,得出排序效果与抽取结果的规模呈正向关系的论点,即一个给定词汇的同义词抽取结果数量越多,排序的效果就会越好。  相似文献   

14.
基于模糊语义距离的多媒体信息检索方法研究   总被引:4,自引:1,他引:3  
张李义 《情报学报》2003,22(2):131-135
与传统的数据库精确查询不同 ,多媒体信息检索的查询条件是不完备的。本文叙述利用模糊语义距离来检索多媒体数据库中信息的原理、算法 ,并将模糊相似测试作为检索结果判断标准 ,最后通过一个示例来说明本方法的使用。  相似文献   

15.
在共指消解领域,目前已经有大量研究工作围绕实体共指问题展开,而有关事件共指方面的研究则相对较少。由于事件表述的灵活性,共指事件识别的研究重点之一在于如何构建事件表述相似度的计算模型。而在对同一事件的相似表述中,不仅包含词级别的同义表述,还包含语句级别的同义表述。针对该状况,本文基于新闻报道语料的特点,一方面针对词级别同义表述模式的抽取,设计了同义词知识库的自动构建策略,并考虑了缩略语、同位语等情况的处理;另一方面在词级别同义表述模式抽取的基础上,设计了语句级别同义表述实例的识别策略,进而可以抽取同义表述模式并剔除模式中的冗余成分。通过在实际数据集合上的实验,表明了本文策略的有效性。基于抽取到的词级别和语句级别的同义表述模式,可以有效提升共指事件识别的效果;本文工作也可以视为对共指事件识别现有策略的有益补充。  相似文献   

16.
基于复杂网络的图书馆个性化推荐服务   总被引:1,自引:0,他引:1  
文章用复杂网络的理论对图书馆的流通记录进行分析。首先利用复杂网络的理论建立借阅记录的网络模型,然后对建立好的网络进行社团结构划分,再利用基于模糊评判的余弦相似度准则计算社团成员的兴趣相关度。最后根据计算出来的结果将信息推荐给读者,实现个性化推荐服务。将复杂网络相关理论应用到图书情报领域,是复杂网络理论的延伸与发展,也丰富了图书情报学研究内容。  相似文献   

17.
This paper explores intellectual and social proximity among scholarly journals by using network fusion techniques. Similarities among journals are initially represented by means of a three-layer network based on co-citations, common authors and common editors. The information contained in the three layers is then combined by building a fused similarity network. The fusion consists in an unsupervised process that exploits the structural properties of the layers. Subsequently, partial distance correlations are adopted for measuring the contribution of each layer to the structure of the fused network. Finally, the community morphology of the fused network is explored by using modularity. In the three fields considered (i.e. economics, information and library sciences and statistics) the major contribution to the structure of the fused network arises from editors. This result suggests that the role of editors as gatekeepers of journals is the most relevant in defining the boundaries of scholarly communities. In information and library sciences and statistics, the clusters of journals reflect sub-field specializations. In economics, clusters of journals appear to be better interpreted in terms of alternative methodological approaches.  相似文献   

18.
[目的/意义] 快速、准确地从突发网络舆情文本中识别事件。[方法/过程] 提出一种融合句法特征和句法相似度的网络舆情突发事件识别方法。结合句法特征提出面向事件的句法特征提取方法,利用事件语义标注和句法特征提取方法构造事件句法特征库,通过计算待测文本与句法库的句法相似度来识别网络舆情突发事件。[结果/结论] 以新型冠状病毒肺炎疫情为例,所提出网络舆情突发事件识别方法在该舆情下的最优相似度为0.93,在此相似度下从一段新的文本中识别出160个事件和30个非事件,F1值达到了0.848。通过方法测评证明网络舆情突发事件识别方法在利用句法相似度识别事件和进行相同相邻词性合并等方面创新的有效性。  相似文献   

19.
如何利用具有本体标注的结构化文档中的语义信息组织P2P网络,提供对基于语义的信息共享与查询的P2P网络支持,是当前P2P网络的研究热点之一.本文提出采用Peer所存储文档中的加权本体概念向量作为Peer的特征向量,通过相似度计算将Peer聚成Peer组,从而构造基于语义的半结构化P2P网络.用户的查询请求由各Peer组内的组服务器负责路由转发,组服务器计算查询请求与各路由表项之间的相似度,将查询向最有可能包含查询目标的Peer组转发.文中较全面地阐述了本体概念局部和全局权重的计算方法.由于P2P网络拓扑的建立过程和查询路由过程均基于语义信息,使得网络的各项性能与基于关键字处理的P2P网络相比,得到了较大的提高.  相似文献   

20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号