首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 718 毫秒
1.
大多数半结构化数据都具有一定的结构规律,将它们转化为基于关系数据库存储的结构化数据,可有效地应用DBMS技术进行处理,部分不便于转化的数据作特殊处理,以保证整个数据的无损映射,本在完成DTD的转换后,从一种最简单的映射方式入手,提出改进方案,利用一种基于数据挖掘的模式抽取方法,对不同类型的元素分别处理,设计了一套有效的溢出数据处理办法,实现了半结构化数据到结构化数据的无损映射。  相似文献   

2.
半结构化数据是网络中一种重要的数据形式,其数据模型研究是半结构化数据各项研究的重要基础,本文介绍了半结构化数据的概念及其几个常见数据模型。  相似文献   

3.
分析了半结构化数据以及半结构化数据模式的特点,XML数据模型在处理半结构化数据方面的应用,并介绍了XML数据与关系数据转换的研究现状。  相似文献   

4.
比较几种主要Web查询语言特点,介绍半结构化数据产生原因并分析半结构数据模式对改进Web查询的重要作用。  相似文献   

5.
半结构化数据OEM图的获取及应用   总被引:1,自引:0,他引:1  
探讨如何从数据集成,电子文档及web网页三种数据源中获取描述数据半结构化特性的有向标注图(OEM图),并例举了半结构化数据的实际应用。  相似文献   

6.
用于改善web搜索的结构化数据抽取技术   总被引:1,自引:0,他引:1  
为了提高web文本搜索质量,提出了基于语义结构化数据的查询扩展方法.通过分析属性的语义特征(文档频率特征和辨识能力特征)将属性分为概念属性、背景属性和无用属性3类,并且提出了衡量属性语义相关度的标准.设计了trie-bitmap和pair pointer table数据结构来实现发掘属性语义特征和检测属性语义相关度的有效算法.通过使用合适的属性和它们的语义关系,可以为查询关键字生成扩展词并将它们嵌入到具有插值参数的向量空间模型中.实验使用IMDB电影数据库和真实文本数据集来比较所提方法和原始向量空间模型的性能.实验结果证明所提出的查询扩展方法可以有效地提高文本搜索性能,同时属性语义特征和属性语义相关度都具有良好的分类能力.  相似文献   

7.
石松 《教育技术导刊》2012,11(9):115-118
非结构化数据是大型企业宝贵的数据资产,其基本特征是数据格式多样、数据存储分散、数据总量大、增长速度快,蕴含有大量提升企业业务价值的重要信息。非结构化数据的统一存储、集中管理与深化应用是当今大型企业信息化建设的重要方向之一。基于企业架构理论设计了非结构化数据管理平台的业务架构、技术架构、数据架构以及应用架构,对面向大型企业应用的非结构化数据管理平台进行了多视角建模,建立了从需求分析到系统设计的桥梁。  相似文献   

8.
由于物联网中非结构化信息占比较大,且信息增速较快,为解决现有方法无法有效处理海量非结构化信息的特征,存在特征提取结果准确性不高与耗时较长的问题,提出物联网中非结构化信息特征自动提取方法.依据非结构化信息描述概念,构建一个四面体结构,实现对非结构化数据的整体描述.采用小波降噪方法去除非结构化信息中的非正常流信息,保证特征...  相似文献   

9.
非结构化数据的海量增多,为数据的挖掘提供了最好的原料,也给予了充分的挑战。 目前,高校数据库里的内容不仅多,而且结构也发生了极大改变,大量的数据是非结构化数据。据统计,全球结构化数据增长速度约为32%,而非结构化数据增速高达63%。这个趋势在高校亦然。对于传统的结构化的数据,由于已经达到一定数量,以关注其应用为主,而对于正在生长的海量非结构化数据,则要关注怎么收集、用什么方式有效管理。“学校正在掌握着越来越多活的数据,这为我们提供了新的方向一一寻找某个规律背后的原因。”相关人士说。  相似文献   

10.
介绍了基于XML技术的WEB信息抽取方法.搭建了WEB信息抽取的三层数据模型,重点在于数据抽取层,在该层先借助于Tidy工具将HTML转换成XHTML,通过Path路径定位与抽取内容相关的锚,再利用XSL将抽取结果映射成XML文件.该XML文件可以直接作为辅助决策的信息源,也可以直接存入数据库为其他所用.这是由非结构化数据向结构化数据转换的一种方法,为应用程序利用WEB中的数据提供了可能.并实现了有关天气预报信息抽取的系统实例,抽取规则简单、健壮,代码移植性好.  相似文献   

11.
介绍了蛋白质数据库中数据的存储和处理、交换、质量、分配和询问.  相似文献   

12.
空间数据挖掘及其在地理信息系统中的应用   总被引:1,自引:0,他引:1  
空间数据挖掘与地理信息系统将成为未来10年应用最热门的技术之一,本文简要介绍了地理信息系统的概念以及空间数据挖掘技术的理论及特点并重点介绍了当前常用的分类、聚类、关联规则等空间数据挖掘方法,并对空间数据挖掘在GIS中的应用作了介绍。  相似文献   

13.
对数据安全中的RAID技术以及数据备份的三种系统方案进行了分析,并在此基础上探讨了当前常用的数据备份设备。  相似文献   

14.
数据挖掘技术在高校图书馆中的应用   总被引:1,自引:0,他引:1  
该文在介绍数据挖掘技术和数据挖掘方法的基础之上,结合目前高校图书馆的实际情况,就如何应用数据挖掘技术进行了研究,并提出了电子数据的数据挖掘模型。  相似文献   

15.
Test fairness and test bias are not synonymous concepts. Test bias refers to statistical evidence that the psychometrics or interpretation of test scores depend on group membership, such as gender or race, when such differences are not expected. A test that is grossly biased may be judged to be unfair, but test fairness concerns the broader, more subjective evaluation of assessment outcomes from perspectives of social justice. Thus, the determination of test fairness is not solely a matter of statistics, but statistical evidence is important when evaluating test fairness. This work introduces the use of the structural equation modelling technique of multiple-group confirmatory factor analysis (MGCFA) to evaluate hypotheses of measurement invariance, or whether a set of observed variables measures the same factors with the same precision over different populations. An example of testing for measurement invariance with MGCFA in an actual, downloadable data set is also demonstrated.  相似文献   

16.
该文介绍了复杂工业过程传统研究方法及复杂工业过程数据处理的困难,对如何将数据挖掘应用于工业过程,实现过程建模及优化的一般步骤进行了综述。  相似文献   

17.
ABSTRACT

This paper introduces the concept of digital structural violence and examines the negative role it could have in future learning systems. To address it, we propose a new interdisciplinary research agenda at the intersection of three current but disparate lines of work that:
  1. Use the concept of epistemic privilege to theorise the inclusion of marginalised learners in the design of learning systems, and utilise participatory action research and emancipatory methodologies to pragmatically ensure this happens;

  2. Support young learners and teachers to understand and build their own artificial intelligence algorithms;

  3. Develop sustainable interdisciplinary links with computer science to address digital structural violence at the algorithmic level and to make its societal implications and underlying processes more widely understood, especially by teachers.

Taken together, these provide for a material form of resistance to digital structural violence and a theoretically and methodologically coherent future research agenda for building just learning systems.  相似文献   

18.
分类在数据挖掘中是一项非常重要的任务,决策树方法是一种常用的方法。本文重点介绍了决策树建立的基本原理,对算法所面临的问题进行了阐述,为数据分类研究者提供借鉴.  相似文献   

19.
机器学习与数据挖掘   总被引:4,自引:0,他引:4  
介绍了机器学习的基本模型和分类,并对数据挖掘的体系结构和实际应用做了分析,最后举例说明了二者的结合及发展.  相似文献   

20.
结构主义语言学有其深远的历史渊源。它的发展经历了五十多年的时间,有着严谨的理论体系。本文就其发展历程作一个简要的论述,以期对整个结构主义语言学有一个更清晰的认识。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号