首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 140 毫秒
1.
共现分析在文本知识挖掘中的应用研究   总被引:1,自引:0,他引:1       下载免费PDF全文
共现分析是将各种信息载体中的共现信息定量化的分析方法,是支撑知识挖掘和知识服务的重要手段和工具。能够体现信息的内容特征和外表特征共同构成了文本知识关联揭示和知识挖掘的基础。探索了共现分析方法在基于空间分析、时间分布和内外关联映射的文本知识挖掘中的应用。图8。参考文献13。  相似文献   

2.
共现分析在知识服务中的应用研究   总被引:16,自引:1,他引:16  
在论证共现分析内涵、方法论和流程的基础上,探索研究共现分析在知识服务方面的应用,具体阐述共现分析在构建概念空间和Ontology实现语义检索、改进知识组织中文本分类效果、分析文献中知识内容关联、挖掘知识价值的应用。  相似文献   

3.
通过总结Web文本挖掘在竞争情报中的应用,尝试将Web文本挖掘方法应用于行业态势分析,提出基于行业态势分析的Web文本挖掘流程,并以2011年上海车展中的相关报道,采用时空分布、词频分析、共现分析等方法对汽车行业态势分析进行实证研究,最后探讨我国汽车行业的发展趋势。  相似文献   

4.
基于深度标引的专利文本挖掘框架研究   总被引:1,自引:1,他引:0  
专利文献中的文摘、权利要求项、全文等文本信息蕴涵了重要技术细节和技术保护等内容,从这些专利文本内容中挖掘具有技术价值、商业价值的潜在信息是当前专利信息应用领域的研究热点.文章研究将面向分析目标的专利文本深度标引应用到专利文本挖掘中,在数据预处理阶段就将分析目标作为知识抽取的基础,专利分析人员可依据分析需求,在文本挖掘时只提取标引结果的某一部分进行分析和处理,这不仅可提高专利文本挖掘的数据预处理质量,也可提高后期文本分析的效率.该文为<数字图书馆论坛>2008年第11期本期话题"科技创新中的专利应用研究"的文章之一.  相似文献   

5.
本文从文本挖掘的定义着手,分析了文本挖掘的过程,包括文本预处理,文本知识发现,文本模式的评价以及文本模式的呈现,并详细介绍了文本挖掘在主动信息服务、信息检索系统、专利信息分析等方面的应用.  相似文献   

6.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

7.
基于文献的知识发现的应用进展研究   总被引:15,自引:0,他引:15  
张树良  冷伏海 《情报学报》2006,25(6):700-712
本文在对共词分析、共引分析理论、Swanson理论以及文本挖掘理论应用进展进行系统研究的基础上,将分别基于上述理论的基于相关文献发现、基于非相关文献发现和基于全文献发现统一整合于“基于文献知识发现”之下,构建起完整的基于文献知识发现的方法与应用研究体系,同时分析了其应用前景。  相似文献   

8.
文章分析维基百科中的文档、目录、超链接、重定向以及消歧义等基本元素与结构关系特点,围绕维基百科在信息检索、文本分类、文本聚类、歧义消解、查询扩展与信息抽取以及本体构建等信息处理任务中的典型解决方法与相关项目,综述和评析基于维基百科的语义知识挖掘的研究与应用方法,从整体上把握基于维基百科的知识挖掘研究现状与进展,为当前知识服务系统建设提供借鉴。  相似文献   

9.
“十一五”期间我国文献情报领域知识发现研究综述   总被引:1,自引:0,他引:1  
对近年来关于知识发现的大量相关论文从概念关系辨析、知识发现方法体系、文本挖掘与文本趋势挖掘、非相关文献知识发现、数据挖掘研究拓展等方面开展研究,总结“十一五”期间我国文献情报领域知识发现研究成果,重点介绍有关知识发现的内容分析、关联理论、领域驱动、可视化、文本挖掘模型等研究进展,最后分析展望今后该研究领域的研究热点和研究方向。  相似文献   

10.
基于概率主题模型的文献知识挖掘   总被引:1,自引:0,他引:1  
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。  相似文献   

11.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

12.
认为利用专利技术功效主题词与专利引文进行共现分析可直观识别核心专利簇的技术功效特征。与专利引文共现分析相比,专利技术功效主题词与专利引文的交叉共现增加了主题标识,使得基于相同标引主题词的被引专利有相似的技术主题和功效特征。同时,不同的技术功效主题词通过专利引文交叉共现,可以识别不同技术主题的关联度以及技术主题对应的功效特征。最后,选择医用显微内窥镜领域相关专利做实证分析,通过技术功效主题词-专利引文、技术主题词-专利引文以及专利引文共现分析,论证专利技术功效主题词与专利引文共现方法在核心专利挖掘方面的特征、优越性及不足。  相似文献   

13.
在当前词共现分析多关注两词共现分析的基础上,提出多词共现分析方法,并采用关联规则挖掘中的频繁项集抽取法,实现多词共现的抽取和与分析.以我国国家知识产权局专利数据库(SIPOD)中数字信息的传输领域(H04L)为例,抽取和深入分析该领域中词最多的多词集合和频数最大的多词集合.最后,结合当前文献计量学中研究热点的定义与识别,应用多词共现分析方法发现H04L领域中的6个研究热点,进而对这6个研究热点中的部分代表性专利文献进行介绍.  相似文献   

14.
基于Web的个性化信息智能挖掘系统的构建   总被引:4,自引:0,他引:4  
将数据挖掘技术和人工智能技术相结合,构建了一种个性化的网络信息智能挖掘系统,详细介绍了其功能,并探讨了该系统对图书馆的信息资源优化建设,以及在获取网络特色化信息、专题化信息等个性化信息服务方面的作用。  相似文献   

15.
基于图挖掘的文本主题识别方法研究综述   总被引:1,自引:1,他引:0  
本文通过文献调研分析,将基于图挖掘的文本主题识别方法总结为中心度方法、紧密关联子图查找和图聚类三种,后两者又细分为基于clique子团或类clique子团、基于图拓扑结构或结点属性聚类的方法。中心度方法通过对比文本网络中术语结点的重要度来实现文本主题的识别,紧密关联子图查找和图聚类方法则是根据文本图中术语结点和边的属性相似度来识别文本核心主题。基于语言文本网络自身特性,如何构建复杂文本关系图来同时揭示术语间的句法、共现和语义关系,如何基于术语关联和图拓扑结构识别其中的紧密关联子团,基于何种标准将紧密关联子团聚类以揭示文本核心主题,都是未来需要进一步深入研究的问题。表1。  相似文献   

16.
[目的/意义]从定量分析和定性分析两个方面对英文网络书评进行内容挖掘,形成一套基于信息分类的英文网络书评的内容挖掘方法体系,实现多文本书评的信息整合。[方法/过程]对书评文本中句子的分类方法、关键信息的提取方法、情感分类的方法以及内容的呈现方式等几方面进行实验和改进。[结果/结论]用户评价结果表明,本文所设计的内容挖掘方法所生成的书评信息摘要在生成质量和有用性两方面都有较好的表现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号