首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 158 毫秒
1.
传统上,检索系统利用基于词语共现分析所生成的自构造词表,即词词关联矩阵来实现模糊检索,这种方式生成的词表存在词间关系单一、语词假相关、词义控制差等问题.本文结合传统叙词表,对自构造词表的词间关联度算法进行了改进,新算法丰富了词间关系类型.实证分析表明,新算法有助于提升系统的检索效率.本文首先阐明词间关联度现有算法及关系数据处理方式,并指出现有算法存在的问题,然后引入叙词表控制机制,针对四种词间关系控制情形提出了各自的词间关联度改进算法.最后通过集合从理论上分析改进算法和现有算法,并借助语词关系网实证改进算法对语词关系网的关联性的影响.  相似文献   

2.
熊霞  常春 《图书情报工作》2010,54(12):50-108
通过调查总结叙词表在文献数据库中的应用现状,在此基础上设计一个基于叙词表的文献数据库知识单元检索系统。该系统首先将数据库中的文献分解为知识单元,检索时用叙词表中的正式叙词对用户输入的检索词进行规范化处理,并将该正式叙词作为中心词,利用叙词表中的词间关系查找出该词的等同词、上下位词和相关词作为扩展检索词,对知识单元进行加权检索,按权值之和以及检索词的密集程度排序输出。经实例分析,具有可行性。  相似文献   

3.
概念间关系是本体的重要组成部分,概念间关系的细化可以消除概念的歧义性。基于叙词表构建本体时,需要对叙词表中的语义关系进行细化调整。在研究中文叙词词间关系的基础上,对叙词词间关系细化提出了一套完整的调整方案,并对此细化方案进行了具体的描述和举例说明。  相似文献   

4.
通过模糊集合检索模型的规范描述,本文首先定义了检索系统中检索效率和系统效率之间的函数关系,并应用该函数关系对比分析模糊集合检索系统和标准布尔检索系统的性能,指出模糊集合检索系统所面临的"囚徒困境":检索效率的提升引起了系统效率的下降.之后针对"囚徒困境",从词词关联矩阵方面来改进模糊集合检索策略,寻求到解决"囚徒困境"的思路和技术手段.最后借助SQL语言演示词词关联矩阵的两种构造策略,建立数学模型分析词词关联矩阵构造的最优时机,并确立该思路为一种新的系统开发模式.根据时机来合理选择词词关联矩阵构造策略有助于改善现有模糊集合检索算法的执行效率,实现检索效率和系统效率的双赢.  相似文献   

5.
采用菱形思维方法解决问题的方式,构建基于本体的概念检索模型,给出关键词的物元发散式扩展和扩展词的量化收敛的算法,并设计相关的检验实验,证明该模型能够提高概念检索的查全率和查准率,解决术语中存在的"一义多词"和"一词多义"的问题,同时实现基于本体的检索推荐功能。  相似文献   

6.
基于主题等级概念知识库的信息自动检索应用研究   总被引:2,自引:0,他引:2  
王兰成  田梅 《情报学报》2004,23(1):40-44
网络技术与智能信息技术为计算机的应用创造了新的环境 ,基于主题等级概念知识库的信息自动检索已成为当前开拓研究和能产生实效的新课题。本文初步实现了主题等级概念知识库 ,研究并提供了关联词表的实现算法 ,设计了词族索引的关系模式 ,并运用于主题信息的自动概念检索。  相似文献   

7.
相关反馈是近年来信息检索领域的研究热点,是自动查询扩展中的一种重要形式,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法,对它们带来的性能改进做了比较,并提出了相关反馈的实际应用中需要解决的一些问题。  相似文献   

8.
中文叙词表本体共建共享系统研究   总被引:6,自引:0,他引:6  
本文阐述了中文叙词表本体(OntoThesaurus,即基于中文叙词表建立的本体知识库)共建共享系统的设计思想和总体结构.描述了中文叙词表转换为OWL本体的扩展TBox定义,叙词表文本的ABox实例自动转换,OntoThesaurus的一致性检测机制;OntoThesaurus在图书情报界及语义Web界的广泛共享应用前景;在共享应用中采集标引员、领域专家和一般检索者知识实现本体共建和动态完善的完整过程.最后对我国叙词表编纂机构快速实现现有中文叙词表(主题词表)的网络化共建和共享服务提出了建议.  相似文献   

9.
介绍了本体概念检索所运用的技术方法,以吉首大学土家族文献全文数据库为例,通过对信息采集、标引、建库、词表管理、用户接口、检索匹配等六个子系统的流程设计,构造了一个典型的特色数据库本体检索概念模型。  相似文献   

10.
利用模糊数学综合评判模型,将科技查新题名分割为自然词,通过计算检索词之间的蕴含度,完成对检索策略过程的模糊量化处理,并利用权重矩阵进行检索词合适程度的综合评判,提取出最合适的检索词和最佳检索表达式。利用查新实例进行该模型的模拟计算试验,结果表明该模型提取的检索词及其组成的检索表达式比较符合实际情况,具有一定的客观性和准确性。  相似文献   

11.
基于本体和加权互信息的专业知识检索   总被引:1,自引:0,他引:1  
李珊  何建敏  厉浩 《情报学报》2006,25(5):559-563
本文针对传统的专业知识检索方法中存在的问题,在本体和信息论的基础上提出了加权互信息的概念,并在检索过程中运用信息论方法来计算检索条件和候选知识之间的相似程度,从而大大提高检索的查准率和查全率。  相似文献   

12.
智能化是信息检索技术发展的一个重要方向,将本体论技术引入信息检索过程实现信息检索智能化得到了广泛的关注和研究.但是,现有的研究仅仅局限于利用本体规范化人-机对篇章词汇概念的一致理解,实现词汇语义级别的信息检索,对本体所具有的推理能力如何应用于信息检索却缺乏有效的解决方法.为了解决这一问题,本文将描述逻辑引入信息检索.一方面,通过建立描述逻辑与领域本体之间的映射关系,规范领域本体的构建,使领域本体具备自动推理能力;另一方面,强调通过语义标注实现领域本体对检索文档的描述.这样,就可以将针对检索文档集合的信息检索转换为针对描述逻辑知识库的推理过程,从而在信息检索过程中引入推理服务,实现智能化检索.文章详细定义了基于描述逻辑的信息检索的概念,阐述了其所提供的各种信息检索服务,并且以一个企业环境中的应用说明基于描述逻辑所实现的信息检索新能力.最后,介绍一种基于描述逻辑的信息检索技术实现方案.  相似文献   

13.
陈立华 《图书情报工作》2010,54(12):124-123
论述叙词表的计算机化管理为转换领域本体创造条件,进行叙词表的概念属性转换本体的理论分析。通过本体转换原理、方法及建模过程的讨论,进一步指出叙词表本体转换的可行性和必要性。并借用农业科学叙词表转换为农业本体的实例来说明OWL语言的实用性及本体理论在信息资源组织过程中的影响与作用。  相似文献   

14.
现有的数据结构导致CSSCI信息服务产生了检索方式简单化和隐含知识获取难两大问题.通过对CSSCI数据结构和内容特点的分析,提出基于本体面向对象的知识组织方式来重构CSSCI学术资源知识结构的解决方案,并试图通过建立概念层次结构和设置概念属性来构建CSSCI本体概念模型,用于表达该领域的知识组织.可以使用Protégé工具以OWL编码方式和图形可视化方式对概念模型进行合婵描述.图5.表1.参考文献7.  相似文献   

15.
[目的/意义] 微信、微博等自媒体中隐含着大量的用户旅游消费需求的信息,将这些信息进行分类并依据分类结果构建需求本体,从而帮助企业分析和研究用户需求以获取巨大的商业价值。[方法/过程] 利用SVM分类算法将微博信息分类并生成分类结果集,这些结果集中包含大量旅游相关概念的词汇,可以作为构建和扩展旅游需求本体的语料;然后通过调查各大旅游网站的类目确定旅游需求的核心概念,抽取分类结果中与旅游相关的概念。[结果/结论] 利用抽取结果匹配核心概念,生成扩展后的本体,使用HOZO本体编辑工具进行修改和完善,并呈现部分旅游需求本体。从实验结果看,本文所提方法能较为准确地对包含旅游需求的文本进行分类。  相似文献   

16.
为了改进基于关键词的信息检索方法的局限性,论文研究了一种综合利用领域本体改善信息检索性能的方法.该方法强调通过交互式的方式引导用户一步步逼近其真实的、潜在的检索需求,使用基于编辑距离的词形匹配方法辅助用户查询本体词汇,使用基于概念空间的检索词联想方法帮助用户扩充检索词.使用基于领域本体的词义识别算法来确定文档中的词汇词义.使用XML技术实现用户查询需求和文档标注的规范化标注.实验表明,该方法会有效提升查全率并且会改进查准率.  相似文献   

17.
基于模糊语义距离的多媒体信息检索方法研究   总被引:4,自引:1,他引:3  
张李义 《情报学报》2003,22(2):131-135
与传统的数据库精确查询不同 ,多媒体信息检索的查询条件是不完备的。本文叙述利用模糊语义距离来检索多媒体数据库中信息的原理、算法 ,并将模糊相似测试作为检索结果判断标准 ,最后通过一个示例来说明本方法的使用。  相似文献   

18.
种子概念方法及其在基于文本的本体学习中的应用   总被引:4,自引:0,他引:4  
介绍基于文本的本体学习及其层次,分析本体学习中术语获取的主要方法。针对术语获取中存在的问题,在术语形成的经济规律基础上,引入种子概念方法,并利用统计和规则两种方法抽取与种子概念相关的领域术语;证明种子概念方法是一种有效获取领域术语的方法。实验证明少量种子词可以获取大量领域术语,为本体构建提供基础和框架。  相似文献   

19.
为了解决用户兴趣建模初期存在的冷启动问题,以科研用户公开发表的学术产出作为用户兴趣建模的数据源,采用文本挖掘和基于本体的模型表示技术进行用户建模,并提出一种通过实体关系表示用户兴趣的方法。该方法与使用单个关键词或实体的表示方法相比,语义信息更为丰富,能更好地描述用户兴趣。最后,将生成的用户兴趣本体实例存储到Sesame本体数据库中,支持通过SeRQL和SPARQL语言进行查询,实现了用户兴趣信息的语义化存储和检索。  相似文献   

20.
分析现有网络信息组织模式及方法,比较本体与叙词表和分类法的异同,从语义网标准体系和本体概念特性两方面阐述本体在网络信息组织中的地位及作用.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号