首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
郝丽云  郭启煜 《情报学报》2007,26(5):741-747
非相关文献知识发现是Swanson教授提出的一种情报学方法,用于挖掘隐藏在文献之间的隐秘联系.其知识发现过程包括两部分开放式知识发现过程和闭合式知识发现过程.开发式知识发现过程是形成假设的过程,可表示为A→B→C;闭合式过程是检验假设的过程,可表示为A→B←C.本文以Medline为数据源,以Mesh字段中的主题词为内容分析单元,进行开放式知识发现的实践.文章共分两部分第一部分模拟Swanson的雷诺病和鱼油、偏头痛和镁缺乏的知识发现的例子,分别以雷诺病(raynaud disease)和偏头痛(migraine)为来源主题词(source subject),寻找目标词鱼油和镁缺乏;第二部分是以2型糖尿病(diabetes mellitus,type 2)为来源主题词,进行主题词分析法的医学实践.研究表明,主题词作为内容分析单元在技术上容易实现,是可行的知识挖掘方法.在实践中还需要探索更好的主题词统计量,进行更精确的类别限定,进一步完善该方法在科研领域的应用.  相似文献   

2.
闭合式非相关文献知识发现方法在中文文献中的验证   总被引:3,自引:0,他引:3  
在基于Swanson的闭合式与开放式知识发现法具体算法过程的基础上,以中国期刊网医药卫生大类的数据为测试集,采用的闭合式和知识发现方法,在中文科技文献中重现了"雷诺氏病和鱼油"、"偏头痛"和"镁缺乏"两对概念的知识发现过程,验证了Swanson的基于非相关文献的知识方法中的闭合式方法在中文文献中同样可行。  相似文献   

3.
目前,生物医学文献的数量正以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.然而,传统的基于简单共现的方法会产生大量的目标词,从而导致准确率下降.本文提出一种新的选取连接词的方法,使用统计特征和文本特征来代替每一个连接词并表示为向量形式,然后把这些词分类为相关和不相关.使用相关的连接词发现目标词,可以提高知识发现的准确率.本文通过Swanson的两组经典实验--雷诺氏病和鱼油、偏头痛和镁,使用有效连接词的比例变化作为依据验证了方法的有效性.最后,本文以H1N1为初始词,进行开放式和闭合式知识发现研究,得到了较好的效果.  相似文献   

4.
非相关文献知识发现研究进展   总被引:12,自引:3,他引:12  
郝丽云  郭启煜 《情报学报》2006,25(3):342-348
随着科学技术的高度发展,学科的分化越来越细,学科间交流越来越困难,知识总量与人类吸收能力之间矛盾日益突出。美国芝加哥大学情报学教授Don.R.Swanson创立的情报学知识发现方法及人机交互系统Arrowsmith,是揭示非相关文献及学科间隐藏联系的强有力的工具。本文介绍了Swanson的情报学思想的产生背景、内涵及其开放式和闭合式的知识发现过程,分析了国内外对该方法的研究和发展,指出Swanson方法的实践所面临的困难及挑战。Swanson知识发现方法强大的情报功能和对医学实践的指导意义,使其在未来的科学发展中具有广阔的推广前景。  相似文献   

5.
基于 UMLS医学本体的挖掘文献间潜在联系的设计与实现   总被引:1,自引:0,他引:1  
以Swanson的非相关文献知识发现的原理为依据,采用自然语言处理技术,将不规范的自然语言转换为UMLS中的概念,同时引入语义过滤系统,开发出非相关医学文献潜在联系的挖掘工具,同时用Swanson发现镁与偏头痛的数据做验证,结果表明,该方法能很好地重现Swanson的研究结果,并且能发现更多的有潜在价值的中介词,具有较高的效率。  相似文献   

6.
吕娜 《图书情报工作》2011,55(24):44-47
在文献调研的基础上,从开放式和闭合式知识发现过程的模拟和改进研究角度梳理Swanson方法的研究框架,分析并建立应用开放式和闭合式知识发现过程的通用算法流程,包括输入、实现步骤、输出和分析控制,并就中文非相关文献知识发现进行分析。  相似文献   

7.
基于文献的知识发现的应用进展研究   总被引:15,自引:0,他引:15  
张树良  冷伏海 《情报学报》2006,25(6):700-712
本文在对共词分析、共引分析理论、Swanson理论以及文本挖掘理论应用进展进行系统研究的基础上,将分别基于上述理论的基于相关文献发现、基于非相关文献发现和基于全文献发现统一整合于“基于文献知识发现”之下,构建起完整的基于文献知识发现的方法与应用研究体系,同时分析了其应用前景。  相似文献   

8.
生物医学文献的数量正在以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.挖掘UMLS语义资源进行计算逐渐成为基于文献的知识发现的热点.Miyanishi等通过概念的语义相似度计算事件相似度取得了比统计方法如tf*idf更好的结果.本文在概念的语义相似度的基础上,加入了概念的语义关联度,避免了事件之间语义相似度高而缺乏语义关联度并导致发现的假设不合理的弊端.本文的方法充分挖掘了UMLS中的语义资源,合理地计算了事件之间的相似度.通过雷诺氏病和鱼油以及偏头痛和镁的实验证明,这种计算方法取得较好的效果.  相似文献   

9.
本文对非相关文献知识发现方法从产生背景、基本概念、研究历程、知识发现过程进行了简要概述,并着重对非相关文献知识发现方法的研究进展进行了总结,分别对该研究领域的杰出研究人员如Swanson、Z.Chen、Gordon、Lindsay、Cort、Weeber、Padmini Srinivasan、Wren等人的研究成果进行了概述,最后从情报学的学科建设、情报学的应用以及情报工作人员的角度探讨了非相关文献知识发现方法的研究意义。  相似文献   

10.
以探寻癌药物靶点间的潜在关联为例,对基于传递闭包的知识发现方法和Swanson的一阶知识发现方法进行了比较,结果得到,运用传递闭包的方法获得知识假设,可能发现更多有意义的新关联,且得到较高查全率的同时,并没有牺牲过多的查准率。  相似文献   

11.
知识发现研究文献定量分析   总被引:3,自引:0,他引:3  
知识发现是指借助于计算机技术来揭示隐含在大量数据中的规律或模式的一种方法。以SCIE和SSCI为数据源,以主题词为检索方式,采用定量分析的方法,确定知识发现领域的核心期刊、核心机构、核心作者,并分析知识发现研究主题和高影响力的学术论文。从而分析出国内外知识发现研究现状与趋势。  相似文献   

12.
介绍了Swanson基于非相关文献知识发现的原理及国内外学者在此基础上进行的研究与进展情况,重点阐述了多种非相关文献知识发现过程的算法模型,提出了把该原理应用与汉语文献进行非相关文献知识发现的设想,并对算法模型进行了初步探讨。  相似文献   

13.
基于知识单元间隐含关联的知识发现   总被引:2,自引:0,他引:2  
温有奎  成鹏 《情报学报》2007,26(5):653-658
面对现代科研环境e-Science,知识合作和新知识发现成为严峻的挑战.本文提出了基于共引知识元间语义关联的隐含知识发现方法.该方法将文献单元分解成知识元,以资源描述框架模式(RDFS)建立由性质P为中心的知识元本体模型,利用知识元间的共引关系挖掘知识元间隐含关联关系,通过隐含关联实现新知识发现.软件试验表明这一方法鼓舞人心.  相似文献   

14.
“十一五”期间我国文献情报领域知识发现研究综述   总被引:1,自引:0,他引:1  
对近年来关于知识发现的大量相关论文从概念关系辨析、知识发现方法体系、文本挖掘与文本趋势挖掘、非相关文献知识发现、数据挖掘研究拓展等方面开展研究,总结“十一五”期间我国文献情报领域知识发现研究成果,重点介绍有关知识发现的内容分析、关联理论、领域驱动、可视化、文本挖掘模型等研究进展,最后分析展望今后该研究领域的研究热点和研究方向。  相似文献   

15.
基于文献内聚度的非相关文献知识发现排序方法研究   总被引:1,自引:0,他引:1  
在对现有非相关文献知识发现中间集排序方法进行分析的基础上,以共现理论为基础,以主题关联度为着眼点,提出基于文献内聚度加权的B排序方法.并以Swanson的早期发现之一为基础,考察经文献内聚度加权和逆文献频率加权两种方法排序筛选后B的范围以及目标关联词和目标关联对的出现情况,以此作为评价其对B影响的依据.结果表明基于文献内聚度加权法能显著提高B的质量,从而提高发现效率.  相似文献   

16.
面向非相关文献的知识关联能够促进新知识的产生,为科学研究寻找新的线索提供了一种便捷、有效的辅助手段。本文首先设计了面向非相关文献的知识关联发现系统,该系统以《中国分类主题词表》为主题词受控词表,通过对文献摘要的中文分词处理,提取主题词并标引,提取文档特征矩阵并利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,从词的粒度层面对非相关文献之间的关系进行挖掘,揭示非相关文献的知识关联。其次,基于该系统为用户精确匹配相关的知识库,采用TOP?K算法反馈与用户相关的文献集,为用户提供满意度更高的知识发现及相关扩展服务。图5。参考文献29。  相似文献   

17.
本文系国家自然科学基金项目:"科学信息离散分布的机理与模型研究,,的第五部分(知识单元离散分布的图形模拟).文章以主题词或关键词表征知识单元,运用L昭istic函数模拟关键词或主题词的分布图像,包括词总数、个数和核心词,得到关键词或主题词总数、个数和核心词的离散分布方程,并用K-S检验对模型进行了检验.  相似文献   

18.
基于非相关文献的知识发现原理研究   总被引:10,自引:7,他引:10  
从Swanson最早提出非相关文献的知识发现方法开始到现在,很多研究人员都投入到这个新兴的领域中去,概括起来分为以下几种方法:基于单词的词频统计方法、基于短语的词频统计方法、基于概念的知识发现方法、基于概念的词频统计方法,本文详细介绍了这些方法基本原理,并对其进行了简单的比较分析。  相似文献   

19.
马费成  陈锐 《情报学报》1999,18(4):376-383
本文系国家自然科学基金项目:“科学信息离散分布的机理与模型研究”的第四部分。文章以布拉德福定律为参照系,以主题词或关键词表证知识单元考察了科学信息的离散分布特征,即分别以载文量、主题词或关键词总数和核心词数为分区标准,研究科学信息在不同分区标准下的分布特征。结果发现,科学信息从文献单元到内容单元其离散程度越来越高。  相似文献   

20.
图书情报领域知识发现研究文献内容分析   总被引:2,自引:0,他引:2  
采用内容分析方法,对图书情报领域的国内核心期刊与SCIE、SSCI上所载的有关知识发现的研究文献分别进行统计分析,比较国内外该领域研究文献的主题分布情况,得出知识发现在图书情报领域的研究热点和发展趋势。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号