首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 109 毫秒
1.
Web 是动态性极强的信息源,访问、分析信息必须研究异构数据的集成问题,并选择合适的技术进行数据 分析、集成和处理。怎样对Web 海量的数据信息进行深层次的应用已成为数据挖掘技术的研究热点。本文介绍了XML (可扩展标记语言)在Web 数据挖掘中的应用,探讨了Web 数据挖掘中的数据异构问题。通过XML技术建立数据抽取模 型,解决互联网上绝大多数因异构、非结构化所导致的Web 数据挖掘问题。  相似文献   

2.
可扩展标记语言在数字图书馆中的应用   总被引:5,自引:0,他引:5  
可扩展标记语言XML是一种元标记语言 ,它使用简单灵活的标准格式 ,为基于Web的应用提供了一个描述数据和交换数据的有效手段。将其应用于数字图书馆 ,不仅可以作为元数据规范的语言基础 ,用于人工智能知识表示、信息检索等 ,而且还可作为一种公认的国际标准格式 ,成为数字图书馆中信息保存和信息交换的理想格式。  相似文献   

3.
十年来,Web存储格式语言,从HTML发展到DHTML,再到今天最新的XML,发展的每一步,都是为了适应Web应用发展的需求。XML在诞生的七年中,以一种超乎寻常的发展速度,如同野火一般在IT应用中扩散。微软已经在NET计划中进行拥抱,而且网络服务动作也得到了XML的刺激。近日,北京红樱枫软件有限公司举办了XML技术应用研讨会,更使我们感受到XML应用大潮迎面扑来的气势。  相似文献   

4.
XML简介及其应用浅析   总被引:2,自引:0,他引:2  
XML是一种刚刚兴起的用于描述网上数据交换的数据文档的格式的一种语言标准。本文简单介绍了XML的基本概念,以及它相对于HTML的技术优势,并阐述了XML的全新应用领域。最后对XML宽广的应用前景作了展望。  相似文献   

5.
Web抽取技术在数字图书馆中的应用   总被引:2,自引:0,他引:2  
从Web页面中挖掘有价值的信息是数字图书馆技术应用的一个重要方式。目前Web页面信息描述大多教是用XML表示的,Web数据抽取技术是Web信息挖掘的关键,文章提出了一种面向HTML或XML描述的web页面的web数据抽取模型并阐述了实现过程。  相似文献   

6.
一、XBRL概述 XBRL(eXtensible Business Reporting Language)是可扩展商业报告语言的简称,是XML(可扩展标记语言)用于财务报告信息交换的一种应用,是目前应用于非结构化信息处理尤其是财务信息处理的最新标准和技术。XBRL实质上是一种数据描述语言,通过它可以使各种商业信息在不同软件、  相似文献   

7.
随着我国信息化的推进,需要将不同阶段、不同技术平台的信息资源进行整合,消除“信息孤岛”,使之集成于一个统一的、开放的构架之中。本文首先阐明了XML文档成为新一代Internet应用中通用的数据格式,崔分析了Web Service技术之后,提出了一种以Web、XML、SOAP技术为核心的异构和分布式的图书信息系统框架,最后给出了一个基于XML文档数据交换的应用实例。  相似文献   

8.
提出一种基于XQuery语言构建Web应用、实现Web信息检索的新方法:在基于XML数据存储的服务器端,XQuery脚本经Qexo工具包转换成服务器可执行程序,能够响应Web用户的信息检索请求,动态生成HTML页返回给用户。  相似文献   

9.
基于Web Service的数字图书馆异构数据集成研究   总被引:1,自引:0,他引:1  
针对数字图书馆数据的异构性,通过研究异构数据的集成方法,提出了基于XML Web Service的异构数据集成方案体系结构,为数字图书馆数据共享提供一种方案。  相似文献   

10.
XML(可扩展标记语言)正在成为Web数据交换的标准格式.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档聚类作为XML数据处理的重要课题,是指将具有类似特征的XML文档聚集成簇.现有的大部分XML文档聚类是基于文档结构特征的.本文提出了一个新的结构与内容相结合的XML文档聚类方法.首先从文档中抽取构件向量,并把文档转换为向量化的表示.然后,在文档相似度计算的基础上,引入一个层次聚类方法对XML文档进行聚类.在DBLP XML记录集上进行的实验表明该方法具有可行性并且性能明显优于已有方法.  相似文献   

11.
XML文档相似度计算方法研究   总被引:1,自引:0,他引:1  
XML(可扩展标记语言)正在成为Web上各种应用交换信息的标准.随着XML格式的半结构数据的大量出现,如何处理和管理XML文档已经成为了一个研究热点.XML文档的相似度计算是XML数据处理的重要课题,是XML文档聚类与检索的关键技术.XML文档由逻辑结构(structure)和文本内容(content)构成,可以根据结构特征或内容特征来度量XML文档之间的相似度.本文将XML文档的相似度计算方法分为基于结构的和结构与内容相结合的两类,并对各种已有的XML文档相似度计算方法进行了比较和述评.  相似文献   

12.
This article presents an empirical study focused on a qualitative analysis of the UNIMARC format. An analysis of the structural quality of the data provided by the format is evaluated to determine its current suitability for meeting the requirements and trends in data architecture for the information network and the Semantic Web. Driven by a set of quality characteristics that identify weaknesses in the data schema that cannot be bridged by simply converting data to MARC XML or RDF/XML, we conclude that the UNIMARC format is not compliant with the current metadata schema desiderata and must be replaced.  相似文献   

13.
MARC的XML交换格式研究   总被引:5,自引:0,他引:5  
在分析MARC ISO 2709交换格式局限性的基础上,对MARC的XML交换格式(MarcXchange和MARCXML)进行分析和研究,阐明MarcXchange的原理、结构、作用和意义,并对MarcXchange和ISO 2709进行比较。针对用OAI实验MARCXML的结果,指出OAI的局限性。最后提出CNMARC应用XML交换格式的具体建议。  相似文献   

14.
数字图书馆建设中的数据交换标准问题刍议   总被引:1,自引:0,他引:1  
从 XML技术脱颖而出的数据交换标准为建立可互用的数字化图书馆提供了数据交换的基本标准和信息展示的工具。重要的技术构件是用 XML Schema来建立电子图书数据标准目录 ;用 UML ,RDF和 XML来进行数据建模和数据描述 ;用 XML技术来创建客户机 /服务器接口的中间层语言 ,创建整合多种不同数据源的数据的转换格式、提供数据统一接口问题 ;用扩展样式表语言 ( XSL)和扩展样式表语言转换 ( XSLT)作信息系统间的数据转换和传输以及使用地理标记语言 ( GML)定义地理空间数据。本文认为 XML技术为数字化图书馆信息整合、资源共享、互用性提供了良好的基础  相似文献   

15.
基于RDF的叙词表研究   总被引:19,自引:4,他引:15  
毛军 《情报学报》2003,22(2):163-168
叙词表在网络中的存在以分布式的叙词关系单元为基础 ,在RDF提供的框架中提供对资源对象的标引和检索服务。XML和RDF对叙词的定义区别在语法和语义上 ,将叙词抽象为概念和词汇两个层次 ,概念之间的关系简化为相关和从属。在客户器 服务器模式下介绍RDF模式传递叙词条目的方法。最后介绍RDF方式的叙词和DC(都柏林核心集 )结合和语义网络 (SEMANTICWEB)两个具体应用。  相似文献   

16.
一种基于Native XML的全文检索引擎   总被引:5,自引:0,他引:5  
王弘蔚  肖诗斌 《情报学报》2003,22(5):550-556
随着XML的日益流行 ,基于XML的全文检索应用需求也迅速扩大。在这些应用中 ,native XML数据库是发展方向。虽然商业化的native XML数据库已经出现 ,但其全文检索的性能还不尽人意。本文提出一种方法 :在传统的倒排索引的框架下 ,对XML的标记建立索引 ,使得一个全文数据库能够以Native的方式存储、索引、检索和输出XML文档 ,成为一个真正意义上的native XML全文数据库 ,既有传统全文数据库的优越性能 ,又能满足基于na tive XML的应用需求  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号