首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 78 毫秒
1.
针对美国和加拿大等高校共同承担的大型跨学科人文文本挖掘项目MONK,详细介绍其文本挖掘流程及相应的工具、技术和算法,并具体探讨利用MONK提供的工具进行文学文本挖掘研究的应用实例。最后总结人文领域文本挖掘方法的几类应用,提出该项目对我国人文领域应用文本挖掘的启示。  相似文献   

2.
指出作为处理海量数据的有效工具,文本挖掘技术近年来在人文社科领域得到广泛重视。概述文本挖掘的相关技术和研究现状,介绍信息抽取、文本分类、文本聚类、关联规则与模式发现等常用的文本挖掘方法在人文社科研究中的具体应用,以拓展文本挖掘的应用领域,并为人文社科研究的方法创新提供新的思路。  相似文献   

3.
数字人文中的文本挖掘研究   总被引:1,自引:0,他引:1  
概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。  相似文献   

4.
"数字人文"是当代信息技术与人文研究融合而形成的一个新兴研究领域,在国内,其理论构建和应用研究都在初步探索阶段。但随着研究的深入,数字人文必将对图书馆工作产生重要的影响。由此,作为数字图书馆建设重要组成部分的古籍数字化工作,应该充分占有数字人文研究成果,从文本挖掘、GIS技术、文本可视化和古籍语料库四个方面进行古籍数字化的深度开发。  相似文献   

5.
崔春  毕强 《图书情报工作》2014,58(24):99-105
关联爵士项目是一项探索关联数据在数字人文领域中应用的实验项目,主要关注如何利用关联数据提升文化遗产文献的可视性,即通过爵士历史的数字档案揭示音乐家之间的关系以及他们在爵士领域的社交网络.介绍关联爵士项目产生的背景、具体内容、开发步骤以及项目中的关键问题,认为其可以为我国关联数据与数字人文领域的结合研究带来一定的启示:采用挖掘实体关系为目标的研究路线与方法、最大化文本来源、发布中文名称规范关联数据、对现有本体进行选择和映射、利用众包方式开展文本分析工作.  相似文献   

6.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性.  相似文献   

7.
在近年信息处理与分析相关技术领域的进展中,文本挖掘是最引人注目的领域之一。文本挖掘是一个方法群,涉及统计学、自然语言处理、信息抽取、可视化等多项信息技术。同很多新兴领域一样,文本挖掘目前并没有统一的定义,没有完全一致的方法与模型,但是,Feldman和Sanger那个很笼统的定义:“可将文本挖掘大致定义为一个知识密集的过程,在此过程中用户与文档集合通过分析工具进行交互”,清晰表明了这种方法与信息分析的内在联系。  相似文献   

8.
基于领域本体实现Web文本挖掘研究   总被引:1,自引:0,他引:1  
阮光册 《图书情报工作》2011,55(18):116-120
为弥补改进传统Web文本挖掘方法缺乏对文本语义理解的不足,采用本体与Web文本挖掘相结合的方法,探讨基于领域本体的Web文本挖掘方法。首先创建Web文本的本体结构,然后引入领域本体“概念-概念”相似度矩阵,并就概念间关系识别进行描述,最后给出Web文本挖掘的实现方法,发现Web文本信息的内涵。实验中以网络媒体报道为例,通过文本挖掘得出相关结论。  相似文献   

9.
总论AELISC 2697-40-12(3)基于领域本体的语义文本挖掘研究/张玉峰,何超(武汉大学信息资源研究中心)//情报学报,2011,30(8):832-839.为了提高文本挖掘的深度和精度,作者研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据  相似文献   

10.
本文从文本挖掘的定义着手,分析了文本挖掘的过程,包括文本预处理,文本知识发现,文本模式的评价以及文本模式的呈现,并详细介绍了文本挖掘在主动信息服务、信息检索系统、专利信息分析等方面的应用.  相似文献   

11.
吴育芳  陆春华 《晋图学刊》2010,(3):34-36,49
本文在介绍了Web挖掘的基础上,重点分析了Web文本挖掘的概念、过程及其关键技术,包括文本的特征表示与提取、文本的分类与聚类等。  相似文献   

12.
Web内容挖掘在数字图书馆中的应用   总被引:3,自引:1,他引:3  
黎琳  赵英 《图书馆学研究》2006,(2):19-21,24
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。  相似文献   

13.
Web文本挖掘浅析   总被引:7,自引:0,他引:7  
首先讨论Web挖掘与Web信息检索的关系,然后重点分析Web文本挖掘,并提出Web文本挖掘的方法,包括文本特征表示、文本分类和文本聚类。最后,提出了利用Web挖掘技术实现Web智能化服务和挖掘引擎的应用。  相似文献   

14.
文本自动分类的测评研究进展   总被引:6,自引:0,他引:6  
分类是文本挖掘的基础和核心,是近年来数据挖掘和网络挖掘的一个研究热点。本文从定性和定量两个方面,介绍国内外文本分类研究现状,分析影响文本分类的重要因素,希望通过对文本分类系统和算法的评测总结发现研究中存在的共同问题,为文本自动分类的优化、改进提供理论和事实依据。  相似文献   

15.
基于文本挖掘的形态分析方法是在传统方法基础上融入文本挖掘的手段,是国内外学者对形态分析方法的一次有益的探索与改进。改进后的方法减轻对领域专家的依赖,并且增加分析过程中客观数据的支持,提高方法的效率和科学性。基于文本挖掘的形态分析方法包括形态结构定义、特征词选择、形态表示、形态分析等4个关键问题,这4个问题解决方案的优化对整个方法的分析效率和质量的提高有关键作用。  相似文献   

16.
基于句子的文本表示及中文文本分类研究   总被引:1,自引:0,他引:1  
文本挖掘技术是信息资源管理的一项关键技术.向量空间模型是文本挖掘中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项只能提供较少的语义信息.为实现基于内容的文本挖掘,本文将文本切分粒度从词语或短语提高到句子,用句子包表示文本,使用句子相似度定义文本相似度,用KNN算法进行中文文本分类,验证模型的可行性.实验证明,基于句子包的KNN算法的平均精度(92.12%)和召回率(92.01%)是比较理想的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号