共查询到20条相似文献,搜索用时 734 毫秒
1.
正大数据时代的到来对传统出版产业带来众多影响,并由此对图书编辑提出了许多新要求,只有适应这些影响且具备相应的应对能力,才能顺应出版产业新形态的时代发展,履行推动文化传播的重要职责。维基百科对大数据的定义为:大数据,或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到在合理时间内无法通过人工达到截取、管理、处理,并整理成为人类所能解读的信息。在总数据量相同的情况下,与个别分析独立的小型数据集相比,将各个小型数据集合后进行分析可得出许多额外的信息和数据关系性,可用来察觉商业趋势、判定研究质量、避免疾病扩散、打击犯罪或测定实时交通路况等,这样的用途正是大数据盛行的原因。 相似文献
2.
一、大数据研究的背景
随着信息技术的不断发展与快速普及,信息交流,数据交换爆炸性增长,大数据时代来了.目前全球的电子化信息量是千万亿兆的数据量,预计2020年整个数据量可能会达到35千万亿兆.著名分析调研机构IDC的研究报告《从混沌中提取价值》显示,仅2011年,全球就产生了1.8ZB(也就是1.8万亿GB)的大数据,由此可见,海量数据就在眼前. 相似文献
3.
大数据不仅指庞大的数据量,同时也是一种解决问题的方式.基于大数据的精确营销在各行各业已经得到广泛应用,对图书馆信息营销也将起到巨大的促进作用.通过对大数据的筛选、挖掘,图书馆可以准确把握用户信息需求,实现资源特点与用户信息需求的精确匹配,在此基础上部署和实施信息营销策略,节约营销成本,提升营销效率. 相似文献
4.
5.
基于数据仓库和OLAP的图书借阅分析系统的设计 总被引:1,自引:0,他引:1
数据仓库和联机分析处理是构建决策支持系统的关键技术.本文实现了基于学生借阅信息的数据仓库的设计,首先用DTS工具实现了异构数据转换,解决了大数据量的数据转换及联机分析处理问题,在这个数据仓库上建立了多维数据集,确立了分析维度和度量.从多个维度与不同粗细粒度出发对学生借阅信息进行了多层次的分析,实现对学生借阅信息的联机分析处理和辅助决策支持. 相似文献
6.
7.
如今,人类的数据处理能力不断提高,大数据不再只是一个单一化的概念.它不仅表示数据量的巨大,而且要求使用者具有对信息存储、挖掘、分析和判断预测的能力.网络作为数据集中的一个平台,比较容易搜集用户在网络上的使用数据.2014年来,各大视频网站利用数据库资源,加大自制节目的开发力度,自制节目的数量呈井喷式增长.作为拥有广泛受众的互联网视频网站,其自制节目在大数据时代迎来了全新的生存环境. 相似文献
8.
一、大数据迅猛发展背景下的贵州新闻业
大数据(Big Data),或称巨量资料,或称为数据集合,其涉及的数据量规模极其庞大,往往无法在有限的时间内通过现在的主流软件工具对其进行抓取、管理、处理.一般单个数据集在10TB左右,其结构不适合原本的数据库系统,是基于云计算的数据处理应用模式.大数据已经被各行各业普遍使用,新闻媒体行业也不例外,无论是新媒体还是传统媒体,都有大数据的参与.从新闻传播角度来说,大数据时代带来了传统媒体时代无法超越的大量和多样化的信息."媒介要做的是从数据到信息、从信息到知识、从知识到智慧的整合,因此大数据时代带来的不仅仅是海量的信息,新闻传媒应该挖掘数据更深层次的应用,从中获取知识,产生智慧."[1]作为信息业前沿的传媒业拥有先天优势,在对大数据的应用、数据的挖掘层面,未来的传媒业发展中不能仅停留在表面,以数据为基础在层次化、个性化、移动化、融合化、语义智能化等方面加入更多的研究要素进行探索和拓展,才是现代媒介大数据研究的发力点. 相似文献
9.
一、大数据的概念
当前,关于大数据的定义,众说纷纭,虽然没有一个统一的描述和定义,但其内涵基本一致.麦肯锡将其定义为:"大小超出了典型数据库工具收集、存储、管理和分析能力的数据集."这说明了大数据不仅体现了数据量巨大,而且是传统方法无法处理的数据集.大数据同过去的海量数据有所区别,正如IBM公司根据其本质将大数据的特征概括成三个"V",也就是规模(Volume),快速(Velocity)和多样性(Variety).
规模是指聚合在一起,供分析的数据量必须是非常庞大的,从TB级别,跃升到PB级别. 相似文献
10.
11.
12.
编者按随着网络用户的高速增长,以及网络终端日益丰富多样化,网络服务的内容与范围不断扩充,用户对互联网的依赖度极大提高,同时这些变化也大大增加了互联网产生的数据量。日益生成和积累用户网络行为数据,增长如此之快,以至于难以使用现有的数据库管理工具来驾驭。这些数据量是如此之大,已经不是以我们所熟知的多少G和多少T为单位来衡量,而是以P(1000个T),E(一百万个T)或Z(10亿个T)为计量单位。目前互联网的形态已经不是单方面接受信息,海量的UGC(用户产生信息)产生前所未有的庞大数据:过去三年里产生的数据量比以往12年的数据还要多,大数据时代的来临已经毋庸置疑。 相似文献
13.
14.
微博语义分析服务的价值在信息泛滥的微博时代,网上社区巨大的数据量已经超出了人力分析的极限,传统的媒体剪报、邮件列表已经不足以反映媒体对某项产品或服务的反应,基于语义分析的新闻服务成为媒体业务创新的方向.微博等社交网络中的文本一般都很琐碎,即所谓"非结构化信息",通常具有以下特征:对特定对象非常有价值,但数据量很小而且非常分散;数据量庞大信息泛滥;在广度和深度上都非常复杂且缺少元数据,无法转换成可以使用的结构化格式. 相似文献
15.
随着“大数据时代”的到来,各种信息数据量剧增,原有的图书数据存储模式由于其包身固有的缺点,已无法适应这种大趋势.全息数据存储技术是近年发展起来的一种新颖存储技术,具有较高的存储密度及数据传输速率等优点.通过对比分析数字图书馆相对于传统图书馆的先进性,并结合全息存储技术的优缺点,阐述了将全息数据存储技术用于数字图书馆建设的应用前景. 相似文献
16.
17.
理论(Theory)、应用(Application),输入(Input)、处理(Process)、输出(Output)是探讨某一学科或领域发展的五要素,以五要素构成TAIPO模型,利用该模型对文献计量分析研究的发展趋势进行探讨.文献计量分析研究将朝着以下几大方向发展:统计规律与理论总结得到更多关注;计量指标与评价体系不断完善;数据量越来越大,异构异源数据互连分析越来越多;计量粒度越来越小,从篇章层次向句段层次发展;自动化程度越来越高,实现信息可视化与报告的自动生成. 相似文献
18.
“大数据”通常被认为是一种数据量很大,数据形式多样化的非结构化的数据,具有规模性、多样性、高速性和价值性的特征.大数据时代,科技期刊出版呈现数据化、多媒体化.科技论文的摘要是其重要的组成部分,因篇幅短、独立性强、信息密集,往往被国内外数据库检索(国际上各主要检索机构的数据库对英文摘要的依赖性很强),进而推送给读者;或者出版单位用微信、QQ平台以文字、视频或声频文件向目标读者推送,读者通过手机、iPad等移动终端快速了解论文的主要内容,来决定是否阅读、引用全文. 相似文献
19.
档案大数据是指一定空间与时间范围内所有档案数据的集合。档案大数据与大数据既有数据量巨大、数据类型繁多、处理速度快的共性,亦有数据相对分散、单一种类档案数据价值密度高、数据可靠性与保真性高的差别。挖掘提取有价值信息,进行科学预测是档案大数据的核心内容。 相似文献
20.
一、大数据背景下档案服务面临的挑战(一)如何在海量数据中查询到所需要的档案信息。随着档案信息化建设的不断推进以及数据量的进一步增大,在进行档案查询时,往往需要的信息会被埋没在大量的不需要的数据中,并且检索性能急剧下降,甚至无法响应。因此,如何在大量的档案中快速而准确地找到所需的信息,是档案服务要解决的首要问题。(二)如何在海量数据中抽取和挖掘有用的信息和知识。依靠人工抽取、挖掘知识,在传统纸质档案时代、档案数量不多的情况下还可实行,但在大数据时代海量档案存在、非结构化数据盛行的今天则会变得心有 相似文献