首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 55 毫秒
1.
一种基于知网的语义相关度计算方法   总被引:1,自引:0,他引:1  
本文以知网理论相似度计算为基础,提出了一种计算词语相关度方法;该方法将知网中不同特征文件间的义原通过其解释义原与其它特征文件中的义原建立联系,进而计算它们之间的相关度,并用该方法提取文本特征,实验结果表明,该方法更趋于合理,绝大部分结果更符合人们的日常体验,有效提高了计算结果的精确度和准确性.  相似文献   

2.
HowNet知识库的义原网状结构的存在,使针对义项间的关系运算成为可能。针对传统词语相似度计算存在的偏差,提出了相应的改进算法,使词语相似度计算更加准确、合理。  相似文献   

3.
词相似度计算在文本分类等自然语言处理众多任务中有广泛应用,为了提高准确率并将其应用于文本分类任务中,提出基于知网与同义词林以及基于nGram训练大规模语料相结合的方法,通过词义演化技术检测词义变化确定两种方法的权重,利用皮尔逊相关系数对比人工定义词语相似度。通过实验将该方法与基于知网和同义词林的方法进行对比,根据随时间改变而词义有无变化选取15对词语进行测试,结果表明后者比前者提高了28%。由此可以看出,基于语料与语义词典的方法明显比单纯基于语义词典的方法好,但仍有较大改进空间。  相似文献   

4.
在中文信息处理中,句子相似度计算是一项基础而核心的研究课题,长期以来一直是人们研究的一个热点和难点.句子相似度计算在实际中有着广泛的应用,它的研究状况直接决定着其他一些相关领域的研究进展,如信息检索的相似句子匹配、自动问答的问题匹配与答案抽取等,句子相似度计算都是非常重要的环节.本文提出了一种基于依存关系匹配的句子相似度计算方法,利用词语内在概念和词语相互依存关系计算句子之间的相似度.结果表明,该算法能显著提高返回结果的准确率.  相似文献   

5.
基于统计的关键词抽取方法忽略了词语的深层语义信息,而词汇链的关键词抽取方法能弥补这一缺陷,但词汇链的构造需要计算语义相似度,而语义相似度的计算需要知识库的支持,提出了一种综合考虑词汇链和互信息模型的关键词抽取算法。首先对文本进行预处理。借助词汇链和互信息模型来表达词语间语义关系,以及对未包含词及相关联度高而相似度值不理想的关键词识别。实验结果表明:在准确率和召回率方面.较基于统计的和基于词汇链的关键词抽取算法均有所提高。  相似文献   

6.
针对FIHC文本聚类算法基于频繁词集实现聚类而未考虑词语间潜在语义联系的缺陷,对FIHC算法进行了有效改进。通过把基于知网的语义相似度计算方法归并到FIHC的Score函数中,有效的改善了score函数单纯的基于向量空间模型的不足。通过实现证明,改进后的FIHC算法明显的提高了聚类质量。  相似文献   

7.
HowNet的构成分析与研究   总被引:1,自引:0,他引:1  
知网是一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之问以及概念所具有的属性之间的关系为基本内容的常识知识库。计算机化是知网的重要特色。本主要分析与研究了知网的哲学思想、构成及其特色。  相似文献   

8.
基于《知网》语义知识资源,提出一种基于问句相似度计算的问答社区问题去重方法。通过计算已有问题集合中问题间的语义相似度,将其中重复度较高的问题进行筛选并去除,从而提高用户获取所需信息的效率,改善用户体验。在“爱问知识人”的真实问题集上的实验结果表明:该方法获得了较好的去重效果。  相似文献   

9.
杨立波 《太原大学学报》2011,12(1):111-113,116
基于CFN的相似度计算是一种相似度计算算法、将此算法与实例机器翻译联系,通过语法,语义两个角度对句子进行观察和分析,并经过CFN标注汉语句子,从两个层面进行相似度计算,并建立实例相似度计算模型,使基于CFN的相似度的计算方法更为简便。  相似文献   

10.
介绍了当前国内外有关词汇语义相似度算法的研究现状,分析并对比了几种具有代表性的计算方法,并将几种常用的词汇语义相似度算法应用于FAQ中,分别采用准确率、召回率、F值以及MRR、MAP5个指标进行评价,根据相似问句的检索效果判断各词语相似度算法的优劣。  相似文献   

11.
从基于"知网"的句子相似度计算的角度出发,研究了文字类主观题批阅的自动阅卷系统,并用文中阐述的理论观点实现了这个系统,达到了预期的目标。  相似文献   

12.
中国知网作为全球最大的中文期刊全文数据库,为科研工作者、期刊编辑、审稿专家提供了很多便利。本文以论文作者的角度,从选题的创新型、查阅参考文献、评审论文相似度以及选择发表期刊和规范参考文献书写格式四个方面对中国知网的使用和作用进行了评价,认为以中国知网为代表的数字图书馆在信息化时代定将成为学术论文写作的有力助手。  相似文献   

13.
安玲 《林区教学》2014,(9):91-93
提出了一种基于测地距离的多文档摘要方法。该方法首先利用可以揭示高维向量相似度的测地距来代替传统的向量夹角作为句子相似度的对比基础,然后通过TextTiling算法进行分割文本,利用基于Wordnet的概念向量空间模型消歧计算段落相似度来构建"文本关系图"产生文摘。在DUC上的实验结果表明,该算法能够有效地生成非受限领域的多篇文档摘要并全面反映文档的主要内容并能有效地提高文档摘要的质量。  相似文献   

14.
针对当前临床诊断知识库融合过程中,领域概念相似度计算所存在的语义融合不充分且计算方法复杂等不足,提出一种改进的基于语义综合加权的概念对相似度矩阵生成算法.根据概念在概念格中的层次结构来确定概念属性特征集合,从概念节点属性信息量、节点层次以及概念非对称性等三个方面对语义距离度量进行扩展,通过引入横向节点透明度算子、纵向节点深度算子以及非对称算子,使最终语义相似度度量结果更精确.并通过使用一个标准的临床诊断知识库概念对该模型进行实验验证,实验结果表明该方法具有可行性和有效性.  相似文献   

15.
文本相似度计算是文本分类、文本聚类、自动文摘、信息抽取的基础.文本相似度计算性能直接影响到文本分类、文本聚类、自动文摘的质量.另外文本相似度还应用于诸多自然语言处理任务中,本文对文本相似度计算问题进行了深入的研究,并根据自然语言的特点提出了通过比较两个文本关键语义对来计算文本的语义相似度.  相似文献   

16.
利用API服务和Mashup应用的注册和组合信息,通过构建Mashup-API网络和API-API网络,在LFH方法的基础上改进Rada & Courtney算法,进行API服务的标签相似度、描述相似度和摘要相似度的计算并最终计算其服务相似度,基于服务的使用场景提出了相应的服务推荐算法,实现了协作关系、竞争关系和其他关系的服务推荐.使用ProgrammableWeb上Mashup应用和API服务的真实数据为载体验证了方法的可行性和有效性,在服务分类和服务推荐方面具有一定的意义.  相似文献   

17.
针对传统过滤算法只能实现结构对应层次的判断这一不足,提出了基于语义的信息过滤新算法。通过分词、计算词语相似度等操作,构造出体现语句语义关系的框架,然后再通过计算框架问的匹配程度来进行过滤。试验证明,过滤效果较传统算法在语义对应层次上有所提高。  相似文献   

18.
以在线词典里的各种语义知识和语义关系为基础,设计并实现一个处理"A is B"型的英文隐喻自动处理系统。该系统采用JAVA语言来编写,包含语句预处理子系统,数据库管理子系统,词义检索子系统,词语相似度计算子系统。系统设计通过仿真实验来验证其可行性,证明了研究的实用价值。并提出了研究的不足及今后的研究方向。  相似文献   

19.
青年人阅读文言文最大的困难是词语障碍。语文教师在指导学生阅读文言文时,不只要讲解清楚一个个词语的含义,更重要的是应该教给他们一些解释词语的方法。利用词语的对应关系释词,是理解词义的重要方法之一。古人行文,常用一些字数相等(或大体相等),结构相同(或相似)的语句,句与句之间在相互对应位置上的词语的意义有相关、相对和相反、相同的几种情况。这类情形,可以称之为对应词语,前人有的称之为之“互文”。这种词语的对应关系,一般是属于修辞中的对偶或排比。但是对应性词语中的意义相同和相反的,相当于同义词和反义词的关系,这两  相似文献   

20.
创造性类推构词中词语模式的范畴扩展   总被引:5,自引:0,他引:5  
以往研究同语素词群,多把类推构词所依据的词语模式视为一种静止的框架,而同语素词群则被视为完全类推的结果。本文认为,多义研究的范式在某种程度上可以为构词研究所借鉴,词语模式也是一种范畴,如词义一样也会产生变异和扩展。大规模类推构词往往牵涉到的是创造性类推,创造性类推导致了词语模式的扩展,扩展的结果就是,一个同语素词群往往关联着若干词语模式,这些模式构成一个类似于多义体系的辐射结构,模式之间呈现着家族相似关系。本文将词语模式分解为属性束,根据属性束之间的相似度来推断词语模式的扩展过程。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号