首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 18 毫秒
1.
面向Web的数据挖掘是当今数据挖掘技术的热点。XML作为直接面向Web数据、基于Internet上的一种新的数据管理手段,为面向Web的数据挖掘带来了便利。分析了Web数据挖掘的特点和XML语言的优点,提出了运用XML解决Web数据挖掘中半结构化数据的模型抽取方法,最后对该方法进行了实例说明。  相似文献   

2.
互联网下的数据获取和Web获取   总被引:1,自引:0,他引:1  
互联网是人类有史以来所面对的最巨大的信息海洋,互联网上的信息源形式多样,既有结构化的数据库中的数据,又有半结构化的HTML页面,还有无结构的文本和图片等数据。笔者在多年的计算机教学中发现,传统的数据处理理论有一个重要假设前提,邪就是对已生成的数据信息进行结构化处理,但就大部分实际问题而言,特别在当今互联网条件下,信息的处理是和信  相似文献   

3.
面向Web的数据挖掘是一项复杂的技术,而XML的出现为解决Web数据挖掘的难题带来了机会。XML的扩展性和灵活性允许XML描述不同种类应用软件中的数据.从而能描述搜集的Web页中的数据记录.  相似文献   

4.
简述了数据库领域中的一些关键性技术,包括面向对象和对象关系的数据库系统;并行数据库系统;数据仓库;Web数据源集成;多媒体数据的支持;数据挖掘和数据可视化技术等。还介绍了未来数据库研究的新趋势和发展方向,包括联邦数据库系统;嵌入式数据库系统;数据库系统的体系结构和基于移动Ad Hoc无线网络的数据库技术等。  相似文献   

5.
基于Web的数据挖掘方法的研究及实现   总被引:2,自引:0,他引:2  
Web上有海量的数据信息,数据挖掘是从大量的数据中发现隐含的规律性内容,充分利用有用数据,废弃无用数据,解决数据的应用质量问题。通过对Web的数据挖掘和XML特点进行分析,讨论了使用XML实现基于Web的数据挖掘方法,提出了一种结合HTML、XML、JAVA的新型数据挖掘技术。  相似文献   

6.
在分析虚拟数据库信息检索的现状、阐述虚拟数据库技术的原理的前提下,针对虚拟数据库基于Web信息检索的局限性,引出了Web数据挖掘,并对Web数据挖掘技术作了概要的介绍。然后,讨论了WEB数据挖掘与虚拟数据库信息检索之间的关系,最后阐述了Web数据挖掘和虚拟数据库信息检索的结合,以提高Web信息检索的效率和质量。  相似文献   

7.
数据挖掘技术是对一组数据应用一种数据挖掘策略,一个特定的数据挖掘技术是由一个算法和一个相关知识结构来定义的。目前,受到最为广泛探讨的是决策树技术。本文试对学生考试成绩数据库进行处理分析,确定该数据库中数据的决策树模型。并提取一定的规则。  相似文献   

8.
要对Internet上巨量的数据进行数据挖掘 ,半结构化数据模型及其抽取技术是前提。对数据挖掘技术和Internet上数据结构的特征进行分析 ,并就把XML作为一种半结构化的数据模型实施查询与模型抽取 ,从而完成面向Internet数据挖掘的方法 ,且结合SQLServer 2 0 0 0的应用进行探讨  相似文献   

9.
数据挖掘与数据库知识发现   总被引:3,自引:0,他引:3  
数据挖掘是解决数据库中数据急剧增大与利用率低之间矛盾的必然结果,数据库知识发现(kdd)技术的应运而生使得人们在实际工作中消耗大量财力和物力的数据得以利用,这也是数据库知识和人工智能技术发展的结果。  相似文献   

10.
主要介绍比较流行的几种Web数据库实现技术,并讨论Web数据库新技术及其今后发展趋势,包括XML数据管理、AJAX技术、网格计算、数据挖掘技术、云数据库等。  相似文献   

11.
XML为Web的数据管理提供了新的数据模,可以说,XML就是WWW上的半结构化数据。本就XML数据管理的几个重要问题进行了阐述。  相似文献   

12.
网络上正在产生的大量的数据主要是HTML格式的数据,可以预计将来的网络上还将产生大量的数据,不过越来越多的将是XML格式。如何有效地存储和检索网络上的XML数据成为一个研究热点。由于数据库技术不断趋于成熟,一种方法是采用数据库对XML数据进行存储和查询等操作。其基本思想就是利用XML数据模式到数据库的数据模式的映射来存储。另外也可以采用文件形式来存储;还可以采用半结构化数据库存储或者采用面向对象数据库存储。  相似文献   

13.
XML是基于Internet上一种新的数据管理手段,以其为基础的新一代WWW环境直接面对Web数据。XML在基于Web的数据挖掘中扮演着重要的角色,本文探讨了XML在Web的数据挖掘研究中进行数据抽取与转换所起作用。  相似文献   

14.
企业目前各种信息系统由于数据格式不一,形成知识孤岛,造成组织所需的大量知识散布在各个异构数据系统中。面对大量的非结构化数据,传统的知识发掘显得力不从心。本文拟通过XML标记语言的特点,将企业信息资源中非结构化数据半结构化,利用基于传统数据库的知识挖掘技术构建基于非结构化数据的知识发掘系统。  相似文献   

15.
《中国教育网络》2014,(Z1):59-60
正如何让云存储服务于应用系统,上海交通大学网络信息中心选择了建设OAuth保护下的开放API体系,使非结构化数据的存储成为一项通用的基础服务。应用系统对非结构化数据存储的需求非结构化数据,通俗的讲就是诸如文本、图像、音频、视频、各种格式的办公文档等等数据,这类数据广泛存在于各类应用系统中,而对于它们的存放,传统上有数据库和文件系统两种方式。我们知道,作为结构化数据存放、检索的手段,数据库扮演着重要的角色,是大多数应用系统的基石,但我们并不推荐在数据库中  相似文献   

16.
XML已成为网络上对数据进行描述和传送的通用语言,XML数据库应运而生。XML数据库是一种新型的数据库技术,它适合于对半结构化数据的存取管理;它能表示和移植数据,具有集成异构数据库系统的能力。XML技术的这些特殊优势将会对网络信息资源的管理产生重大影响。  相似文献   

17.
大多数半结构化数据都具有一定的结构规律,将它们转化为基于关系数据库存储的结构化数据,可有效地应用DBMS技术进行处理,部分不便于转化的数据作特殊处理,以保证整个数据的无损映射,本在完成DTD的转换后,从一种最简单的映射方式入手,提出改进方案,利用一种基于数据挖掘的模式抽取方法,对不同类型的元素分别处理,设计了一套有效的溢出数据处理办法,实现了半结构化数据到结构化数据的无损映射。  相似文献   

18.
应用系统对非结构化 数据存储的需求 非结构化数据,通俗的讲就是诸如文本、图像、音频、视频、各种格式的办公文档等等数据,这类数据广泛存在于各类应用系统中,而对于它们的存放,传统上有数据库和文件系统两种方式.我们知道,作为结构化数据存放、检索的手段,数据库扮演着重要的角色,是大多数应用系统的基石,但我们并不推荐在数据库中存放非结构化的数据,一方面数据库存取此类数据的效率低下;另一方面,大量的非结构化数据存在于数据库给数据库的性能和维护都带来负面影响.相对于数据库,我们更推荐在文件系统中存放非结构化数据,但是这也对开发人员提出了很高的要求:在性能方面,为了应对可能的大文件数量,文件存放的目录结构需要设计,为了支持负载均衡,文件数据的同步需要考虑;在安全方面,对于Web系统,允许上传文件到文件系统有着巨大的风险,由于运维人员无法实施严格的安全策略保证文件系统不被改写,一旦系统存在漏洞,上传非法代码执行的例子屡见不鲜.  相似文献   

19.
伴随现代商业规模不断的扩展以及信息化技术不断的发展,在对大量商业信息进行处理之时,数据挖掘技术所起到的作用是巨大的.伴随互联网的不断普及,使得数据挖掘技术也成为现代商业获取市场信息极为重要的一个载体.文中就Web数据挖掘技术的挖掘过程以及特点进行了简要介绍,并对Web数据挖掘技术在现代商业里的运用进行了重点研究,以期为我国Web数据挖掘技术的应用提供可供参考的意见和建议.  相似文献   

20.
互联网是人类有史以来所面对的最巨大的信息海洋,互联网上的信息源形式多样,既有结构化的数据库中的数据,又有半结构化的HTML页面。还有无结构的文本和图片等数据。笔者在多年的计算机教学中发现,传统的数据处理理论有一个重要假设前提,那就是对已生成的数据信息进行结构化处理,但就大部分实际问题而言,特别在当今互联网条件下,信息的处理是和信息的获取融合在一起的。如果在数据处理相关课程的教学中,忽略互联网下的信息获取规律的阐述,学生们无论在理解上还是在兴趣上都会大打折扣。本文拟就结构化数据和半结构化Web的获取规律从系统工程角度做一些初步归纳总结,供从事计算机教学的同仁参考。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号