共查询到19条相似文献,搜索用时 484 毫秒
1.
2.
文本分类是网络主题舆情分析中的关键技术,传统Web文本分类将文本关键词的相似度作为分类依据,丢失许多重要的语义信息,导致分类结果不够准确且计算量大.本文提出一种基于语义相似度的Web文本分类方法,利用特定的领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量,给出Web文本相似度的计算公式并实现基于语义相似度的KNN算法.结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少计算量并提高了分类精确度. 相似文献
3.
传统的Web文本分类方法将文本中关键词的相似度作为分类的依据,丢失了很多重要的语义信息,导致分类结果不够准确且计算量大。基于此,文章提出了一种基于语义相似度的Web文本分类方法,利用领域本体将用关键词表示的文本特征向量表示为与之匹配的语义概念特征向量集,定义Web文本相似度的计算公式,设计并实现基于语义相似度的KNN算法。实验结果表明,该方法从语义概念层次上表示和处理Web文本,降低了文本特征空间维度,减少了计算量,提高了分类精确度。 相似文献
4.
生物医学文献的数量正在以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.挖掘UMLS语义资源进行计算逐渐成为基于文献的知识发现的热点.Miyanishi等通过概念的语义相似度计算事件相似度取得了比统计方法如tf*idf更好的结果.本文在概念的语义相似度的基础上,加入了概念的语义关联度,避免了事件之间语义相似度高而缺乏语义关联度并导致发现的假设不合理的弊端.本文的方法充分挖掘了UMLS中的语义资源,合理地计算了事件之间的相似度.通过雷诺氏病和鱼油以及偏头痛和镁的实验证明,这种计算方法取得较好的效果. 相似文献
5.
结合语义相似度与相关度的概念扩展 总被引:6,自引:0,他引:6
本文研究在本体构建的语义网环境下,量化领域概念的关联程度扩展概念,实现概念检索的问题.利用语义的层次结构和蕴涵关联计算语义相似度和相关度,并结合二者,提出语义扩展度的概念及计算方法,由此控制调整扩展概念集的范围和大小.经过实例计算与分析,验证并阐明了该方法的合理性、有效性及其特点. 相似文献
6.
基于叙词表的概念语义相似度计算 总被引:3,自引:1,他引:2
语义相似度计算是信息处理技术中的一个关键问题。提出基于叙词表、基于距离的概念语义相似度计算方法,详细叙述其计算流程。在此基础上,利用《农业叙词表》中的实际数据展开分析验证,从计算结果上看该方法基本可行,从实用的角度出发,可为叙词表的应用作一些尝试和探索。 相似文献
7.
8.
基于本体的语义相似度计算方法研究综述* 总被引:5,自引:0,他引:5
孙海霞钱庆成颖 《现代图书情报技术》2010,26(1):51-56
在对基于本体的词语语义相似度进行界定的基础上,对基于本体的语义相似度研究进行综述,分别阐述基于距离的语义相似度计算、基于内容的语义相似度计算、基于属性的语义相似度计算和混合式语义相似度计算等算法模型,最后从宏观层面指出今后本领域的研究方向。 相似文献
9.
通过对馆藏资源本体相关定义和特点进行分析,在传统语义相似度计算方法的基础之上,提出了一种综合的基于馆藏资源本体模型的语义相似度算法。并构建了竞争情报资源本体,对该算法进行了实例分析。该算法为馆藏资源本体的语义相似度计算提供了一种有效的量化途径。 相似文献
10.
借鉴Rodriguez和Egenhofer提出的语义相似度计算模型,结合医学领域主题词表MeSH的特点,提出MeSH主题词表中的语义相似度计算方法,实验结果证明该方法是有效的。 相似文献
11.
采用形式概念分析的方法,对知识集成建模过程进行研究和分析;在此基础上利用本体来描述知识模型,提出基于形式概念分析的知识集成过程模型,并通过实例验证建模过程。结果证明在建模过程中引入FCA可以产生创新知识概念,提高网络资源的查全率;还可以对知识概念异构整合,消除同形异义词,提高网络资源的查准率。 相似文献
12.
提出一种新的领域本体学习方法,结合形式概念分析(FCA)与关联规则挖掘从非结构化文本中获取情报学本体。该方法从文本集中通过种子-扩展机制的方法获取领域核心概念,构建文档概念格(文档×关键词矩阵),在此基础上通过形式概念分析方法来识别概念之间的等级关系,通过关联规则挖掘概念间的相关关系。最后,采用基于"黄金标准"的方法对本体学习的结果进行评价,结果表明:通过这种方法构建的本体可以达到较高的领域知识覆盖率,而且能够识别概念之间部分隐含的关系,从而验证该方法在领域本体的构建中实用且有效。 相似文献
13.
研究基于形式概念分析(FCA)的学科知识结构探测方法,提出基于FCA的学科知识结构的定义和表示模型,详细阐述基于FCA的学科知识结构的构建方法。以图书情报学为例,以SCI和SSCI收录的16种图书情报学期刊在2001-2013年间的数据为样本,对基于FCA的学科知识结构探测方法进行实证分析。研究探测到新世纪以来图书情报学的9个主要研究主题,并揭示每个研究主题的核心关键词和活跃作者。与传统的知识结构探测方法相比,基于FCA的方法不仅能有效、合理地描述复杂概念及其层次关系,还能客观地显示出聚类和关联特征。 相似文献
14.
15.
领域本体自动构建研究 总被引:4,自引:1,他引:3
本体作为语义基础被广泛应用于信息检索、人工智能、语义网络和知识管理等领域.然而本体的构建和维护工作费时费力,影响了本体的广泛应用.因此,研究者们尝试利用机器学习、数据挖掘等技术自动构建本体,提出诸多本体自动构建的理论和方法.本文在总结现存本体自动构建方法的同时深入研究了基于FCA(Formal Concept Analysis)的本体自动构建方法,主要包括:基于PAT-Tree的统计分词,文档特征选择,基于文档-关键词的形式背景生成,最后用FCA构建本体.实验表明,基于FCA的本体构建方法明显提高了本体自动化的程度,构建的本体具有较好的可信度. 相似文献
16.
传统的专家识别系统大多采用一组带权重的关键词来表征专家的专长,然而这种基于关键词的专长描述不足以概括专家的研究主题。提出基于领域本体概念的专长表示方法,通过构建相应的领域本体来描述领域核心概念和概念间关系,利用谷歌距离来计算关键词到本体概念的语义相似度,完成关键词到概念的映射,从而得到基于本体概念的专长表示。 相似文献
17.
18.
Ontology 和 FCA在知识建模中的融合机理研究 总被引:2,自引:0,他引:2
张云中 《现代图书情报技术》2010,26(3):40-46
针对Ontology与FCA在知识建模中的融合问题,对比Ontology和FCA之间的异同,从哲学视角、代数结构视角、知识处理与知识管理视角分析Ontology和FCA融合的条件,剖析二者在知识建模过程中的融合机理,最终得出Ontology和FCA在知识建模过程中融合的8个具体方向,为Ontology和FCA在知识建模领域中的融合研究提供启发。 相似文献
19.
针对如何运用FCA完善信息系统建模理论的问题,明确信息系统建模要解决的核心问题和利用FCA在解决上述问题的优势,指出FCA在信息系统建模中的应用方向,提出一套基于FCA的信息系统建模理论,并结合实例详细阐述应用FCA进行子系统划分的方法和构建静态模型、动态模型和功能模型的原理。 相似文献