首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 6 毫秒
1.
基于词汇链的应急预案主题抽取方法研究   总被引:1,自引:0,他引:1  
本文针对应急预案自动主题抽取的需求,采用词汇语义相关度计算的方法,构建了一个基于词汇链算法且符合人的主观感受的主题抽取模型.模型根据应急预案文本的特点,运用了自然语言处理技术,改进了原始的词汇链生成算法,提出了一种多因素词语权重算法.通过与人工抽取主题词的实验结果相比较,该主题提取模型在查全率和查准率上都取得了较好的效果.  相似文献   

2.
XTM的主题相关度的量化机制研究   总被引:1,自引:2,他引:1  
主题图XTM作为一种用于描述信息资源知识结构的工具,在信息和知识资源的整合领域有着广泛的应用前景。然而,在XTM技术框架中只定义了主题之间的关联,并没有给出相应的相关度评价方法,而且关联只局限在彼此有直接关联的主题之间,并没有定义间接关联。因此有必要为主题图引入相关度的评价,进而更清晰地理解主题图的语义结构。针对这一问题,本文在对XTM中主题关联语义结构的分析的基础上,通过划分主题关联种类,从XTM抽取出其树形的语义层次结构。在此树形结构的基础上,引入语义距离的概念进行对主题图的二级关联扩展和关联间语义相关度的计算。并在在相关算例的验证过程中,得到了较好的计算结果。  相似文献   

3.
基于本体的语义相关度计算方法以概念在本体中的结构特征,如深度、密度,概念间的语义关系类型、路径等一系列因素为基础来度量概念间的语义相关度,缺乏对传递因素的考虑.本文通过基于本体的通用语义相关度计算方法的影响要素分析、传统方法的特点研究及语义传递规律的介绍,提出一种基于传递的语义相关度计算方法,并利用<知网>与传统方法基于人工判断进行效果比较,验证了新语义相关度计算方法的应用效果.  相似文献   

4.
整合中文维基语义的网络论坛话题追踪方法研究   总被引:1,自引:0,他引:1  
研究中文维基语义图上的网络论坛话题追踪,对于提高舆情分析系统获取情报的效率及信息处理质量有很大价值.以涉军主题帖子为背景,借鉴维基百科语义相关度与词语共现关系,构建反映词语间静态与动态关联的文本概念图,改进PR算法的关键词挖掘方法,利用维基知识解决论坛文本中的语义特征稀疏问题,减少噪音以提高论坛文本语义相关度计算的准确性.最后实验证明该方法的优越性.  相似文献   

5.
歧义字段的处理是汉语自动分词系统中重要而困难的问题之一.歧义处理正确率的高低直接影响着分词的质量.为了解决汉语自动分词系统中的歧义问题,本文基于<知网>的义原关系,在分析了影响词语语义相关度的主要因素后,引入相关度计算,利用<知网>中义原之间的纵向和横向关系及实例因素计算出不同词性的相关度,根据相似度的对称性计算实例的影响因素,由此来提高语义相关度的准确率,同时针对所提出的方法给出了实例验证.实验结果表明,该方法计算得到的语义相关度结果更加合理,为消除汉语自动分词中的歧义问题提供了良好的支撑依据,也使得汉语自动分词系统处理歧义字段更有效.  相似文献   

6.
本篇论文以去除网页噪声,整合网页内容为目标,提出了面向主题型网页,根据网页规划布局抽取网页内容的方法.算法首先分析原始网页的DOM结构生成标签树,再根据标签分类和对应节点的信息对标签树自底向上进行划分,并依据划分块的文字密度,链接密度及图片密度,分类信息块.进一步,提炼网页主题的文本特征向量,采用基于词条空间的文本相似度计算,获取划分块的主题相关度,以主题相关度为量化基准剔除噪声,识别网页主旨内容,重构页面描述.这一算法被应用于面向人才资讯的信息采集项目中,实验表明,算法适用于主题型网页的"去噪"及内容提取,具体应用中有较理想的表现.  相似文献   

7.
基于本体的语义检索技术研究与实现   总被引:3,自引:0,他引:3  
在本体基础上通过语义相似度和相关度的计算,利用语义推理将描述的隐含语义显式化,以充分挖掘出与检索内容相关的信息,实现相关信息的语义融合,提高查准率和查全率。研究基于本体的语义相似度和相关度的计算方法,并通过该语义检索方法的实现,证明该方法在语义检索系统开发中的可行性。  相似文献   

8.
基于知网和术语相关度的本体关系抽取研究*   总被引:1,自引:0,他引:1  
 提出一种基于知网和术语相关度的关系抽取方法。首先通过句法分析提取术语的上下文特征,结合自然语言特征和互信息的方法计算术语之间的相关度,然后使用术语的义原和动态角色作为关键词,在知网语义关系框架中定位关系,并为关系指定明确的语义标签。实验结果表明该方法具有较好的实用效果。  相似文献   

9.
李向阳  张亚非 《情报学报》2005,24(1):100-106
简单分析了语法上界定汉语短语的困扰,提出一种利用语义搭配关系界定汉语短语的方法。首先,借助同义词词林实现语义知识的编码,用这种语义编码来表示语义搭配关系;其次,在此基础上,定义短语与已知语义搭配关系的相似性,计算词语搭配的合理性;最后,利用短语内部的语义搭配合理性优于其他搭配这一性质,用算法实现了基于语义的汉语短语界定过程。该方法应用于军事文本,从中界定出描述作战单位等信息的短语,取得较好的效果。此外,经该方法界定出的短语具有较强的语义信息,对信息抽取等实际应用具有一定的适用性。  相似文献   

10.
多相关主题的主题文本资源相关度算法研究   总被引:1,自引:0,他引:1  
主题图作为一种新型的信息资源整合工具,在数字资源整合领域有着广泛的应用前景.主题图中资源与主题间的相关度在一定程度上反映了资源与用户查询需求间的相关程度.基于此,本文提出了一种主题文本资源间相关度算法,主要从资源本身及用户动态使用行为两方面深入分析.相关算例试验结果表明,该算法相对稳定,整体上对文本资源排序的效果较好.  相似文献   

11.
客观知识体系中的相关性研究   总被引:1,自引:1,他引:0  
本文针对信息科学领域相关性研究对客观知识体系中相关性(即语义相关)的忽略问题,对语义相关进行了较全面的综述性研究,从语义相关的概念理解、语义相关与检索相关的比较、语义相关与知识组织的关系、语义相关度量方法以及语义相关的应用5个方面展开了论述,旨在清晰语义相关内涵,强调语义相关在信息科学领域相关性研究中的基础性地位,突出语义相关对知识组织深化的决定性作用,从而引起学者对客观知识体系中相关性研究的高度关注.  相似文献   

12.
以提高领域概念相关性判断的准确度为研究宗旨, 提出综合利用中文维基百科的分类体系结构和概念释义内容进行概念间语义相关度计算的方法.选取中文维基百科分类体系下的图书情报领域的概念为实验对象, 将基于分类信息和文本信息的加权算法与单独基于分类信息的语义距离算法和信息量算法, 以及基于文本信息的文本重叠算法进行对比分析.实验结果表明:加权算法能取得更好的效果, 可为实现面向领域的信息检索、领域本体构建等应用提供重要技术支持.  相似文献   

13.
本体中同种语义关系间的可传递规律研究   总被引:2,自引:2,他引:0  
语义传递是研究知识组织、语义相关度以及知识挖掘与推理等信息科学领域的关键因素,但是由于缺乏语义传递判断的计算机模拟限制了其在信息科学领域的应用.语义关系间的可传递性是语义传递判断的关键因素,其规律性特质反映出了语义传递的相对稳定性,这种稳定性使得语义传递判断的计算机模拟成为可能.本文主要围绕同种语义关系间的可传递性规律获取方法,基本获取方法的经典型语义关系的传递规律,规律检测以及传递规律应用四个方面展开了研究,目的在于为语义传递判断的计算机模拟以及语义传递在信息领域中的应用提供基础.  相似文献   

14.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

15.
Web数据关联创建策略研究   总被引:1,自引:0,他引:1  
调研关联数据的关联关系创建算法和策略,分析同构模式下属性相似度和图形相似度算法以及相应的组合策略,对比研究异构模式下包含和不包含实例信息的架构映射方法,对可创建丰富语义关联的推导传递的思想进行剖析,并提出关联创建面临的挑战。  相似文献   

16.
Usage of field-normalized citation scores is a bibliometric standard. Different methods for field-normalization are in use, but also the choice of field-classification system determines the resulting field-normalized citation scores. Using Web of Science data, we calculated field-normalized citation scores using the same formula but different field-classification systems to answer the question if the resulting scores are different or similar. Six field-classification systems were used: three based on citation relations, one on semantic similarity scores (i.e., a topical relatedness measure), one on journal sets, and one on intellectual classifications. Systems based on journal sets and intellectual classifications agree on at least the moderate level. Two out of the three sets based on citation relations also agree on at least the moderate level. Larger differences were observed for the third data set based on citation relations and semantic similarity scores. The main policy implication is that normalized citation impact scores or rankings based on them should not be compared without deeper knowledge of the classification systems that were used to derive these values or rankings.  相似文献   

17.
针对当前主流语义Web服务匹配方法过分强调服务请求与服务广告的精确匹配从而导致用户在实际中难以获得真正所需要的Web服务、或在服务自动发现与集成任务中计算负荷过大的问题,本文把基于本体的概念语义相关性度量模型引入Web服务匹配,提出一个新的更"轻便"的语义Web服务匹配模型.该模型使用一系列概念组分别描述服务的服务类别、输入、输出、前提、效果等诸方面的语义信息,在此基础上通过基于本体的概念组之间的相关性度量模型分别评价服务请求与服务描述在这些方面的语义匹配度.总体语义匹配度被定义为输入、输出、前提、效果方面的语义匹配度的加权和.基于这一匹配模型,本文进而研究了相应的服务匹配器原型.初步的数据试验表明,本文所提模型能较好地适应用户需求表述的模糊性,从而提高服务匹配的召回率;从计算复杂性看,本文所提模型也优于基于严格逻辑推理的语义Web服务匹配模型.  相似文献   

18.
王小玉  董诚  曾文 《情报工程》2015,1(6):102-108
本文对科技政策及语义分析方法研究现状的进行了调研,重点对句子相似度匹配算法和段落相似度匹配算法,以及倾向性分析算法等几种语义分析方法进行了对比分析,并总结其各自的适用性和优缺点,为下一步科技政策语义分析模型的构建研究提供研究基础。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号