首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
采用本体概念映射方法,研究概念间相似度计算问题并提出本体图驱动的概念相似度算法。该算法将概念映射到本体结构图上,通过计算概念的语义、结构及属性相似度得到综合相似度。其中,结构相似度通过语义辐射圆计算模型得到,属性相似度通过概念重心向量夹角余弦得到。通过实验对比证明,该算法在一定程度上提高了相似度准确性,为数据挖掘提供了一定依据。  相似文献   

2.
语义相似度计算在信息检索、文本聚类、语义消歧等方面有着广泛的应用。为提高信息检索的查全率与查准率,提出一种本体概念综合语义相似度计算方法。该方法在本体概念语义距离的计算中引入了多种权重因子,并且综合考虑了本体概念语义重合度、本体概念属性对相似度的影响。实验分析发现,该方法比传统计算方法更加准确、有效,具有一定的理论及实用价值。  相似文献   

3.
为了提高语义Web服务的发现性能,从Web服务描述上下文中抽取语义标注的约束信息并生成新的更精确的语义标注,从而减少语义标注与参数之间的语义偏差,精化Web服务的语义描述.首先,从本体定义中抽取概念的约束模板,并对Web服务的描述文本进行句法分析;然后,根据约束模板,从句法分析树中抽取语义标注的约束信息,并构造新的概念表达式作为对应参数的新的语义标注.最后,提出了一种新的语义相似度度量方法以度量概念表达式的相似度.实验结果表明:该方法能够提高语义Web服务发现的平均准确率,且计算代价相对较小.从描述文本中抽取概念的约束信息,能够减少标注的语义偏差,更精确地表达语义Web服务的语义,提高Web服务的发现性能.  相似文献   

4.
Deep web站点查询界面的潜在语义分析   总被引:1,自引:0,他引:1  
为了进一步提高搜索引擎的效率,实现对deep web中所蕴含的大量有用信息的检索、索引和定位,引入潜在语义分析理论是一种简单而有效的方法.通过对作为deep web站点入口的查询界面里的表单属性进行潜在语义分析,从表单属性中挖掘出潜在语义结构,并实现一定程度上的降维.利用这种潜在语义结构,推断对应站点的数据内容并改善不同站点的相似度计算.实验结果显示,潜在语义分析修正和改善了deep web站点的表单属性的语义理解,弥补了单纯的关键字匹配带来的一些不足.该方法可以被用来实现为某一站点查找网络上相似度高的站点及通过键入表单属性给出拥有相似表单的站点列表.  相似文献   

5.
评价复杂网络节点影响力主要依靠节点的度、邻近度、介数和K-shell等中心性指标值,但此类方法的挖掘精度和适应性均不理想。提出了一种新的复杂网络节点影响力评价模型——KSC中心性度量模型。该模型不仅考虑节点的内部属性,还考虑节点的外部属性。通过SIR模型进行了仿真传播实验,实验结果表明,该算法适用于各种复杂网络并且能够很好地发现影响力更大的传播节点。  相似文献   

6.
为了提高用户之间相似度度量的性能,充分利用用户的社会信息,提出一种考虑潜在用户分组信息的相似度度量方法.该方法首先为用户的分类属性建立权值分类树,并基于此分类树,采用统一框架计算用户分类信息和数值信息的距离;然后利用该距离改进k-means聚类方法,以计算用户的潜在用户分组;最后结合用户分组信息改进传统相似度度量方法.基于真实数据集Movie Lens进行实验,并与其他传统方法对比,结果表明,与传统方法相比,所提方法提高了协同过滤中的预测精度.  相似文献   

7.
通过对目前各种本体映射方法的分析,提出一种改进的本体映射的方法.该方法考虑了概念的名称、实例、属性、关系对相似度计算的影响,使概念相似度的计算更加全面、准确.  相似文献   

8.
有效检测程序设计类课程作业抄袭现象具有重要的现实意义。传统的代码相似度检测方法主要利用代码属性或结构信息判定代码之间的相似性。基于已有的属性度量与最长公共子序列算法,提出一种代码相似度检测算法,算法将属性度量的结构无关性与最长公共子序列算法的结构依赖性有机结合。实验结果表明,该算法可以有效降低程序源代码的评测难度,得到较为可信的综合相似度值,增强了评测人员对抄袭现象的监测力度。  相似文献   

9.
基于统计的关键词抽取方法忽略了词语的深层语义信息,而词汇链的关键词抽取方法能弥补这一缺陷,但词汇链的构造需要计算语义相似度,而语义相似度的计算需要知识库的支持,提出了一种综合考虑词汇链和互信息模型的关键词抽取算法。首先对文本进行预处理。借助词汇链和互信息模型来表达词语间语义关系,以及对未包含词及相关联度高而相似度值不理想的关键词识别。实验结果表明:在准确率和召回率方面.较基于统计的和基于词汇链的关键词抽取算法均有所提高。  相似文献   

10.
分析了2个大型语义网络HowNet和WordNet的全局意义结构.发现两者都是具有小世界和无尺度特征的复杂网络,但具有一些独特的属性.两者连接度分布的幂律指数介于1·0和2·0之间,而不是像许多常见的无尺度网络一样接近于3·0.连接度相关系数都小于0,与生物性网络相似.BA模型以及与其相似的一些模型不能对其动力学加以解释.节点连接度与其聚集度指数之间遵循标度律,表明网络中可能存在自相似的层次结构.认为人类学习语义知识的几种主要方式如聚合与隐喻等影响了语义网络的这些结构特征.  相似文献   

11.
本体匹配解决了本体异构问题,作为本体匹配的关键技术,相似度算法决定了匹配的精度和效率。WordNet中概念节点的语义距离常作为相似度算法的依据。设计了一种新的语义距离计算方法及相似度算法,并以此搭建一个本体匹配框架进行了验证。  相似文献   

12.
传统句子相似度算法没有全面考虑句子结构与语义特征,影响相似度计算准确性,对此提出一种基于句法块向量的句子相似度计算方法。该方法综合考虑句子的语义信息与结构信息,首先构建两句子的语义依存关系树,然后进行一些被动转换等操作,最后根据词向量构建各个句法块向量并通过余弦值计算句子相似度。在常规句子对中进行测试实验,结果表明,综合句子结构与语义信息可提高相似度计算准确性。一般句子相似度计算正确率达到92%,比传统方法提高8%~10%。  相似文献   

13.
中文信息处理研究应以应用开发带动理论研究和技术研发。我国中文信息处理研究已在三个方面取得了重要进展:应用理论研究方面,语义的知识表示方法从句子扩展到了句群层面,构建了概念—语句—句群统一的知识表示模型;知识库资源建设方面,建立了达到应用规模的、包括概念知识库、语言知识库和言语知识库的多层次语义知识库资源;中文智能搜索引擎核心技术研发方面,实现了文本的语义分析和多层次的语义索引技术,以及基于语义理解的文本相似度计算技术,使用户可以用最自然的语言提出搜索请求,而不必受关键词的约束。基于语义的新一代中文搜索引擎即将出现大的突破。要提高我国中文信息处理的竞争力,应当重视具有自主知识产权的基于语义的理论和应用研究,加强人才队伍建设,进行科学组织和管理,促进以智能搜索技术发展及应用为主线的中文信息处理产业联盟的构建。  相似文献   

14.
本文在中文维基百科知识库的基础上,对文本语义相关度计算进行了研究.实验选取了2014年12月15日在中文维基百科网站下载的主题文章,进行处理后作为语义概念知识库.在Words-240测试集上的实验结果表明,该方法比基于Word Net的LSA算法的效果要好.  相似文献   

15.
本文借助中文维基百科知识库,提出基于ESA算法的文本分类算法.并选取2015年3月5日在中文维基百科网站下载的主题文章,对其进行适当处理,将处理结果作为该算法使用的语义概念知识库.在复旦大学中文文本分类语料上显示的实验结果表明,该方法比纯粹的词袋模型方法效果要好.  相似文献   

16.
Shadowed集自提出以来,已经成功应用于很多领域,而相似度量是其中的关键技术之一,但目前还没有见到一种好的相似度量方法。首先讨论Shadowed集的距离以及加权距离;然后定义了二个Shadowed集上的新的算子,并提出一种度量Shadowed集之间的相似度的方法以及一种加权相似度量方法;最后将其应用到模式识别和多指标评价模糊决策。  相似文献   

17.
为了提高KNN检索策略的检索效率和检索结果的质量,提出一种改进的KNN检索策略。在引入图书馆领域本体和概念语义相似度度量技术的前提下,利用句法结构筛选不合理的案例以降低计算规模,从而提高案例的检索质量和效率,利用改进的微粒群算法优化概念语义相似度度量技术中的组合参数以提高KNN检索的结果质量。实验数据采用福州晓锋科技信息咨询有限公司提供的图书馆参考咨询测试数据。实验结果表明,相比于传统KNN和基于传统PSO的改进KNN方案有效地提高了案例匹配结果的查全率和查准率。  相似文献   

18.
为了对异质异构数据资源进行语义集成并提供统一的智能访问接口, 利用语义Web技术发布机器可理解的数据资源及其之间的关系, 以支持智能搜索等功能. 介绍了中医药智能搜索引擎TCMSearch, 该搜索引擎的核心为一个集成语义知识库, 该知识库利用领域本体来表示中医药领域的实例及其之间的关系. 首先, 针对普通文本, 系统采用了机器学习的方法对其进行语义标注; 对于关系型数据库数据, 则采用了语义映射的方法统一其语义信息. 然后, 系统为集成的数据资源构建了一个语义索引, 该索引采用本体语言RDF/OWL进行表示, 从而支持一些强大的推理功能, 如类层次关系推理和实例关系推理. 最后,通过利用该语义索引以及其支持的推理功能, 系统能够在集成知识库的基础上提供智能化搜索, 如关联搜索、语义图浏览以及实例推荐等新功能.  相似文献   

19.
为有效评估复杂网络中节点的重要性,特提出了一种基于经典度排序方法的合度排序算法.合度排序算法是在节点度的基础上提出了邻度和合度的概念,通过计算每个节点的合度值来评估节点在网络中的重要性,即合度值越大,节点在网络中的重要性越高.并利用经典的度排序算法、接近度排序算法及新提出的合度排序算法对同一网络拓扑图的节点进行排序,证明了合度排序算法的有效性.  相似文献   

20.
句子相似度计算模型在基于实例的机器翻译中有着举足轻重的地位。提出了一种基于多特征加权的句子相似度计算模型,在对中文句子的词形、词序、句法和语义4种特征相似度计算的基础上,融合这4种特征,通过采用不同的特征权重来调节不同特征对句子相似度计算的影响,使得句子相似度计算更加准确。实验结果表明,该算法在计算句子相似度方面准确性较高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号