排序方式: 共有171条查询结果,搜索用时 18 毫秒
81.
在这个信息飞速发展的时代,海量数据的增长过快,用户查询数据时对软硬件要求高,系统资源占用率高。采用云计算模式,SaaS(Software-as-a-Service,软件即服务),通过互联网的应用模式让多个用户来访问,云计算中心会统一管理数据。SaaS这种模式统一管理数据,成本低,效率高。本文采用SaaS(Software-as-a-Service,软件即服务)模式来搭建和测试云计算平台。 相似文献
82.
网络信息提取技术对于人们高速准确的从海量数据中提取所需要的信息变得非常重要,面临海量计算所带来的挑战,提出了基于MapReduce的网络信息提取方法,以淘宝网为数据源,提取用户对商品感兴趣程度,通过实验仿真,表明该方法对于海量网络信息提取具有较高的效率和很好的适应性。 相似文献
83.
银行业在实现业务和数据集中处理的信息化架构后,随着业务的发展,面对数量越来越多、规模越来越大的批处理需求,如何提高计算资源的使用效率和灵活配置资源是银行信息中心不断面对的挑战。以资源和应用虚拟化为核心的云计算架构和技术正在不断发展和成熟,它可以有效地提高信息中心的资源使用,为批处理业务动态配置有效资源。针对以批处理中按照业务类型和处理流程进行资源配置的传统方法,提出了一种将业务流程进行优化分解成为可以进行独立并行处理任务的方法,可以在云计算环境下分组处理具有共同特征的计算和操作任务,实现优化资源调配。通过HadoopMapReduce并行计算架构进行模拟验证,初步实验结果表明了该方法在批处理执行效率、资源使用和灵活性方面的优势,在大量批处理业务领域(金融、证券、电子商务)具有一定的应用和研究价值。 相似文献
84.
网站通常从用户中分析挖掘出其中隐含的规律,为其创造更多的价值.随着互联网的普及,互联网的用户成指数级增长给互联网传统的分析算法带来了极大地挑战.本文针对网站中存在的海量用户数据,设计了基于MapReduce分布式编程框架的协同聚类算法.该算法是分布式并行地统计聚类信息,更加高效地分析处理用户数据,完成网站中的用户行为分析工作.实验表明,本文提出的算法不仅具有很高的加速比,而且具有很好的可扩展性. 相似文献
85.
86.
面对海量邮政寄递数据,现有的构建于关系数据库上的数据仓库系统在做数据分析时具有建设成本高、分析能力会遇到瓶颈等缺点。Hadoop具有高可扩展、高性能和低成本等优点,被广泛应用于大数据的存储和分析。基于对Hadoop开源框架的研究,设计邮政寄递大数据分析系统,并对该系统进行部分实现。结合邮政安监系统工程需求展开实验,得出大数据分析系统的性能参数,为后续工程建设提供依据。 相似文献
87.
88.
开发海量数据处理系统时存在技术框架选择不确定问题。从理论及应用角度对两种主流的海量数据处理架构MPP和Hadoop进行对比,分析各自技术特点,阐述其与传统数据处理的优势。分析结果表明,Hadoop在存储数据规模上可轻松支持PB级别,而MPP架构大多只支持TB级别;Hadoop对海量半结构化、非结构化数据存储和处理有一定优势,但在处理速度和易用性上不及MPP;在结构化数据处理、响应性能和衍生工具等方面MPP 则占优,适用于查询业务场景较多项目。通过分析两大框架底层核心技术以及归纳优缺点,为企业相关应用的技术选型提供参考。 相似文献
89.
随着大数据时代的到来,大数据应用已经深入到大众生活的很多方面。国际漫游的分析也可以基于大数据来实现,其具有较好的节假日可视化效果、能有效的指导网络优化和支撑数据变现。文章通过国际漫游多维度分析这个典型大数据应用,介绍大数据应用实现的各个环节,向大众揭开大数据处理的神秘面纱。 相似文献