排序方式: 共有171条查询结果,搜索用时 15 毫秒
11.
蔡劲松 《西安文理学院学报》2015,(2):61-64
大数据为数据挖掘提供了丰富的数据源,从中挖掘出的信息更加具有商业价值.以Hadoop的大数据处理为核心,通过查找相关文献资料,实证分析了大数据处理的策略,从而为未来大数据处理路径提出更好的指导. 相似文献
12.
大数据正在改变了人类世界,本文介绍了大数据技术兴起的背景、研发和应用的总体情况、面临的挑战和未来的发展趋势,对大数据技术的发展和研究进行了全面性的综述。 相似文献
13.
14.
本文首先介绍了云计算的分类、特点,并且以微软私有云为例子,介绍了私有云计算的概貌、系统中心组件、自动化流程和应用程序层的实现原理和细节;然后分析了教学资源平台存在的问题,并且针对这些问题,把微软私有云融和到教学资源平台设计的各个关键技术中,阐述了私有云为教学资源平台带来的潜在价值. 相似文献
15.
数据管理和基于数据分析的决策对企业的管理和生产越来越重要。大数据时代无论是大中企业还是小微企业,对数据进行处理、分析及整合,正成为企业提升核心竞争力的有效方式。使用数据平台技术手段推动大数据的挖掘技术、分析能力和运算速度,使企业在大数据下研究并寻找数据的相关性和其有用的信息,让企业更好地适应市场变化,增加经济效益。 相似文献
16.
在阐述图书馆检索系统现状、分析云检索系统给图书馆带来好处的基础上,提出了一个基于开源云计算Hadoop的分布式文件系统HDFS、分布式计算模型MapReduce和分布式数据仓库Hive相结合的图书馆信息检索平台,探讨了云检索系统中的关键组件,实验结果显示该系统在大规模数据检索方面具有很好的性能。 相似文献
17.
李萍 《大学图书情报学刊》2014,32(5):35-41
文章通过使用Hadoop计算平台,以K-Means算法为例,分析其在Mahout中的并行化策略。通过对读者的借阅数据进行分析研究,应用数据挖掘技术逐步建立应用模型,有效地将数据挖掘技术与图书馆个性化服务紧密地结合在一起。 相似文献
18.
提出了基于HBase的海量钻井数据存储技术。将HBase的分布式存储特点和钻井工程的实际需求相结合,设计了一个快速、高效、安全的海量钻井数据存储方案。介绍了HBase的存储模型以及系统架构,详细描述了钻井数据在HBase分布式存储系统中的存储过程。 相似文献
19.
针对传统关联规则 Apriori 算法难以适应大数据的问题,为提高可信计算平台日志数据分析效率, 提出了一种基于Hadoop的可信计算平台日志分析模型。构建了日志分析模型总体框架,对非结构化原始日志数据进行垂直划分,采用分布式文件存储系统,结合MapReduce编程模式给出一种分布式Apriori并行垂直算法。通过日志挖掘建立用户行为关联规则库,并采用规则匹配实现对用户异常行为的检测。理论分析和实验数据证明,该模型在大数据环境下能够有效提高日志分析效率。 相似文献
20.
《实验室研究与探索》2016,(1):169-172
随着互联网和Web技术的飞速发展,现代社会的信息量迅速增长,中国已经步入"大数据"时代。Hadoop作为Apache基金会的开源项目,是一个分布式计算框架,主要处理大量数据,在业界和应用行业尤其是互联网行业得到了广泛应用。因此,研究它非常必要。本文对Hadoop的特点及其子项目进行深入探讨,以Hadoop1.1.0为基础,设计面向计算机基础教学的系列实验,从环境搭建、并行编程到数据迁移等七个方面,它涉及到Hadoop的多个子项目,形成一定的深度和广度。使学生能够更加深入了解和学习Hadoop,为今后的学习奠定扎实的基础,以便培养更好的Hadoop人才。 相似文献