首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 484 毫秒
1.
面向Web的数据挖掘是一个非常前沿的研究问题,其主要目标就是找出符合Web的数据结构及相关模型。现在,人们通常把Web的结构看作是半结构化的。面向Web的数据挖掘首要解决的是寻找半结构化数据源模型问题。以XML为基础的新一代WWW环境是直接面对Web数据的,不仅可以良好地兼容原有的Web应用,而且可以实现Web中的信息共享与交换。XML是"可扩展标记语言"的缩写。XML规格是由全球信息网标准制定组织(W3C)制定,并于1992年成为推荐规格,目前已有许多家厂商采用,且视为关键性技术,如Adobe、IBM、Microsoft、Netscape、Oracle、Sun等。目前许多新版的软件,如Navigator、Internet、Explorer及RealPlayer,都已经在软件内部使用了XML的技术。XML技术在Web数据挖掘中应用于以下几方面:  相似文献   

2.
E-knowledge的内涵、特征与功能分析   总被引:2,自引:0,他引:2  
e-knowledge是一种融合知识内容、知识环境和知识应用的电子化知识体系与知识空间。它是以知识节点、知识网络、知识共享、电子化学习为基础,具备知识管理、内容管理、个性化知识服务、平衡结构化学习与自主学习、融合知识管理与电子化学习等多种功能。  相似文献   

3.
Web是知识管理系统(KMS)信息采集的重要来源之一,但其数据的庞杂无序和半结构化特性给信息采集工作造成了一定难度.文章对Web信息采集机制,特别是HTML结构特征分析法进行了探讨,并结合采集机制研究,以建立企业名录信息库为例,说明采集系统如何最大限度地提高KMS基础信息采集的能力.  相似文献   

4.
吴清强  张晓林 《情报学报》2007,26(6):863-868
作者从当前情报分析过程中无法有效地集成各种不同资源、工具的现状出发,分析了将各种不同的资源、工具集成的必要性并引入了情报复合应用框架.在对Web服务框架以及情报服务实例分析的基础上,提出了基于Web服务的情报复合应用框架,并对情报服务集成中的服务发布、服务发现与服务使用和流程编排进行了初步的实例描述.该文对情报业务流程的描述只停留在总体框架上,没有对具体情报业务的流程进行详细的细分和细节的描述.另外,作者主要考虑了结构化数据的情报分析流程,但在实际情报分析业务中,有很多非常有用的非结构化、半结构化数据,如何将这些数据融入该情报复合应用框架中,有待于继续深入地研究.  相似文献   

5.
重庆图书馆开发大数据分析试验系统,没有国内行业案例可借鉴,主要基于其他行业既有的大数据实践经验,结合本馆的业务需要进行分析和建设。就目前重庆图书馆数据来源的实际情况,开发大数据应用系统,主要依靠现有信息系统的数据源,这些数据有的是结构化的,有的是半结构化或者非结构化的,通过对这些数据的累计、分析,摸出规律、得出结论,对内,指导本馆业务工作。对外,指引读者阅读方式,挖掘原有数据的使用价值。  相似文献   

6.
数字图书馆知识发现系统平台构建策略研究   总被引:1,自引:0,他引:1  
知识发现技术是一种从大量数据中获得有效的、新颖的、有潜在应用价值的和最终可理解的模式的高级处理过程,它通过数据准备、数据挖掘及模式识别与评价等步骤来实现知识发现,其系统一般架构分数据源、数据挖掘器和用户界面三层,在此基础上构建了由用户界面模块、数据预处理模块、数据挖掘模块、知识模式表示和评价模块、知识库管理模块五部分组成的数字图书馆知识发现系统模型,为数字图书馆知识发现系统平台构建提供策略。  相似文献   

7.
高校校园网信息资源数量巨大.各信息发布系统的相互独立及多种异构数据源的使用对在校园网范围内进行统一的信息检索设置了障碍.系统着重解决由非结构化文本数据和结构化数据库数据形成的多数据源的集成与整合问题.在Nutch搜索引擎基础上利用Lucene接口对多种源数据建立索引.构建多数据源全文信息检索平台,从而有效地实现全网信息检索并提高检索速度和精度。  相似文献   

8.
构建基于Web数据挖掘技术的信息服务系统   总被引:5,自引:0,他引:5  
介绍Web数据挖掘的种类和方法,提出一个基于Web数据挖掘的信息服务系统结构,该结构以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善文献情报机构的服务质量。  相似文献   

9.
知识发现研究文献定量分析   总被引:3,自引:0,他引:3  
知识发现是指借助于计算机技术来揭示隐含在大量数据中的规律或模式的一种方法。以SCIE和SSCI为数据源,以主题词为检索方式,采用定量分析的方法,确定知识发现领域的核心期刊、核心机构、核心作者,并分析知识发现研究主题和高影响力的学术论文。从而分析出国内外知识发现研究现状与趋势。  相似文献   

10.
以来自Web of Science数据库(1975~2011年)的以信息行为主题的2520条文献为数据源,借助CitespaceⅡ软件对相关被引文献和主题词等数据进行分析和处理,以知识图谱的方式对信息行为研究的知识基础、研究热点、研究前沿进行分析。发现2个明显的聚类展示出信息行为研究的2个分支领域;2个分支内的经典基础理论和模型很好地展示了信息行为领域研究的知识基础;9个高频关键词表征了信息行为的研究热点;2003年以来的7个突现词和若干个高频关键词表征了信息行为的研究前沿。  相似文献   

11.
信息素质网络教育资源的建设方略   总被引:16,自引:0,他引:16  
论述建设信息素质网络教育资源的意义,指出信息素质能力是一种综合能力,由基础到高级可分为基础信息素质能力、通用信息素质能力和基于学科的信息素质能力。开发不同内容层次的信息素质网络教育资源,构建多种形式的信息素质网络教育资源,是开展网络教育的基础。  相似文献   

12.
科学数据仓储是未来科学数据出版的主导性媒介之一。本文以数据出版流程为切入点,从数据提交、数据存储、数据审核和数据发布4个方面对科学数据仓储的出版功能进行分析,试图为规范科学数据仓储的出版功能提供建议:建立以自助提交为主的提交模式,制定本仓储科学数据质量审核标准,施行自动审核与人工审核并行的质量审核方式,采用多渠道发布数据集,为数据集提供数字对象唯一标识符。  相似文献   

13.
New York University's (NYU) Data Service Studio has recently launched the NYU Survey Service, whose ultimate aim is to support the development and administration of surveys of all types. For the Web-based component, the service utilizes a product called Qualtrics, which allows university affiliates to develop and administer Web-based surveys. This article describes the process by which NYU came to offer the service during a time when concerns abound about the ability of libraries to support and expand offerings while still meeting institutional imperatives such as robust data services. While many considerations went into the evaluation and ultimate conclusion to pilot the service, this article considers those most related to library collaborations, undergraduate instruction, data and information literacy, learning and research, and application administration and support.  相似文献   

14.
虽然关联数据在国内图书情报领域的认知已普及,但在书目资源上的应用推进仍较缓慢。本文引介联合国粮食及农业组织发布的《书目数据开放关联化指南》(LODE-BD),通过借鉴国外书目资源的关联数据实践经验,以期促进国内信息资源序化理论与实践的融合。本文重点辨析了基于RDF的三对基本概念,解读了M2B概念模型,分析了元数据模式的通用属性组设计,介绍了LODE-BD的决策树选择流程创新做法。最后在分析LODEBD的基础上,提出书目资源开放关联化的5圈层结构,为国内书目资源的开放关联化提供系统化实施参考。  相似文献   

15.
档案数据是重要信息资源,档案数据开发能够挖掘档案数据价值,提高档案数据治理能力。文章梳理档案数据开发研究现状,分析档案数据协同开发的内涵与特点,进而剖析传统模式下档案数据开发的弊端,构建包含理念上的相互信任、行动上的相互协同、结果上的相互共赢三方面的档案数据协同开发新模式。  相似文献   

16.
伴随着科学数据管理服务的需求,数据馆员的教育培训成为开展科学数据管理服务的关键。文章通过对国内外数据馆员培训的典型案例进行调研和比较研究,从重视数据素养教育、开放培训学习资源、开发系列培训课程、加强多方协作等方面为我国科学数据馆员的培训提出相关建议。  相似文献   

17.
伴随物联网和互联网技术的发展与应用,数字化档案信息资源呈现爆炸式增长,传统的关系型数据库在海量档案信息资源数据读写效率中存在着诸多的性能瓶颈,如何满足不断增长的档案信息资源数据存储需求成为共享平台建设研究的重点。在对档案信息资源共享平台数据存储需求分析的基础上,对档案信息资源存储系统进行了模块设计,提出了采用HDFS结合Redis作为共享平台数据存储系统的总体架构的方法,并对档案信息资源存储的性能进行测试对比。采用HDFS作为共享平台的存储系统架构支撑,结合Redis缓存技术,能够快速提升档案信息资源的存储处理性能,为档案信息资源共享平台的数据服务提供可靠的基础保障。  相似文献   

18.
档案信息化建设中的数据管理   总被引:1,自引:0,他引:1  
档案信息化建设中的数据管理包括数据组织、设计、使用、维护及安全控制等方面,涉及一系列标准、规范、规程、策略的制定与执行。在大范围档案资源共享的要求下,对档案数字数据的管理,体现了档案信息化建设的水平和持久性,卓有成效的数据管理,是档案数据整合、共享的前提,也是当今档案信息化建设发展的需要。  相似文献   

19.
数据保存策略与生命周期管理   总被引:2,自引:0,他引:2  
随着数字资源的膨胀,图书馆将面临资源典藏与存储匮乏的矛盾。引入数据生命周期的概念,控制资源无限膨胀的趋势,达到利用与保藏的平衡点,是本文讨论的重点。  相似文献   

20.
WorldWideScience.org is a Web-based global gateway connecting users to both national and international scientific databases and portals. This column will provide background information on the resource as well as introduce basic searching practices for users.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号