共查询到16条相似文献,搜索用时 78 毫秒
1.
2.
3.
数字人文中的文本挖掘研究 总被引:1,自引:0,他引:1
概述数字人文的概念、研究内容和现状,指出文本挖掘方法是数字人文研究的一个研究热点与趋势。在综述文本挖掘在数字人文各个研究领域中的具体应用基础上,重点介绍欧美发达国家文本挖掘应用于数字人文研究的前沿实践,以期为我国人文学科研究方法与范式的转型提供借鉴。 相似文献
4.
"数字人文"是当代信息技术与人文研究融合而形成的一个新兴研究领域,在国内,其理论构建和应用研究都在初步探索阶段。但随着研究的深入,数字人文必将对图书馆工作产生重要的影响。由此,作为数字图书馆建设重要组成部分的古籍数字化工作,应该充分占有数字人文研究成果,从文本挖掘、GIS技术、文本可视化和古籍语料库四个方面进行古籍数字化的深度开发。 相似文献
5.
关联爵士项目是一项探索关联数据在数字人文领域中应用的实验项目,主要关注如何利用关联数据提升文化遗产文献的可视性,即通过爵士历史的数字档案揭示音乐家之间的关系以及他们在爵士领域的社交网络.介绍关联爵士项目产生的背景、具体内容、开发步骤以及项目中的关键问题,认为其可以为我国关联数据与数字人文领域的结合研究带来一定的启示:采用挖掘实体关系为目标的研究路线与方法、最大化文本来源、发布中文名称规范关联数据、对现有本体进行选择和映射、利用众包方式开展文本分析工作. 相似文献
6.
为了提高文本挖掘的深度和精度,研究并提出了一种基于领域本体的语义文本挖掘模型.该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据库,设计了一种基于语义的模式挖掘算法挖掘文本深层的语义模式.实验结果表明,该模型能够挖掘文本数据库中的深层语义知识,获取的模式具有很强的潜在应用价值,设计的算法具有很强的适应性和可扩展性. 相似文献
7.
在近年信息处理与分析相关技术领域的进展中,文本挖掘是最引人注目的领域之一。文本挖掘是一个方法群,涉及统计学、自然语言处理、信息抽取、可视化等多项信息技术。同很多新兴领域一样,文本挖掘目前并没有统一的定义,没有完全一致的方法与模型,但是,Feldman和Sanger那个很笼统的定义:“可将文本挖掘大致定义为一个知识密集的过程,在此过程中用户与文档集合通过分析工具进行交互”,清晰表明了这种方法与信息分析的内在联系。 相似文献
8.
基于领域本体实现Web文本挖掘研究 总被引:1,自引:0,他引:1
9.
本刊编辑部 《图书馆理论与实践》2012,(3):103-112
总论AELISC 2697-40-12(3)基于领域本体的语义文本挖掘研究/张玉峰,何超(武汉大学信息资源研究中心)//情报学报,2011,30(8):832-839.为了提高文本挖掘的深度和精度,作者研究并提出了一种基于领域本体的语义文本挖掘模型。该模型利用语义角色标注进行语义分析,获取概念和概念间的语义关系,提高文本表示的准确度;针对传统的知识挖掘算法不能有效挖掘语义元数据 相似文献
10.
本文从文本挖掘的定义着手,分析了文本挖掘的过程,包括文本预处理,文本知识发现,文本模式的评价以及文本模式的呈现,并详细介绍了文本挖掘在主动信息服务、信息检索系统、专利信息分析等方面的应用. 相似文献
11.
12.
Web内容挖掘在数字图书馆中的应用 总被引:3,自引:1,他引:3
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。 相似文献
13.
Web文本挖掘浅析 总被引:7,自引:0,他引:7
王连军 《现代图书情报技术》2002,18(6):38-40
首先讨论Web挖掘与Web信息检索的关系,然后重点分析Web文本挖掘,并提出Web文本挖掘的方法,包括文本特征表示、文本分类和文本聚类。最后,提出了利用Web挖掘技术实现Web智能化服务和挖掘引擎的应用。 相似文献
14.
文本自动分类的测评研究进展 总被引:6,自引:0,他引:6
分类是文本挖掘的基础和核心,是近年来数据挖掘和网络挖掘的一个研究热点。本文从定性和定量两个方面,介绍国内外文本分类研究现状,分析影响文本分类的重要因素,希望通过对文本分类系统和算法的评测总结发现研究中存在的共同问题,为文本自动分类的优化、改进提供理论和事实依据。 相似文献
15.
16.
基于句子的文本表示及中文文本分类研究 总被引:1,自引:0,他引:1
文本挖掘技术是信息资源管理的一项关键技术.向量空间模型是文本挖掘中成熟的文本表示模型,通常以词语或短语作为特征项,但这些特征项只能提供较少的语义信息.为实现基于内容的文本挖掘,本文将文本切分粒度从词语或短语提高到句子,用句子包表示文本,使用句子相似度定义文本相似度,用KNN算法进行中文文本分类,验证模型的可行性.实验证明,基于句子包的KNN算法的平均精度(92.12%)和召回率(92.01%)是比较理想的. 相似文献