大数据框架学习:从Hadoop到Spark
Hadoop软件库是一个利用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理的框架。特点:部署成本低、扩展方便、编程模型简单。Hadoop实现了在行业标准的服务器上进行可靠、可缩放的分布式计算,让你能够以较低的预算跟踪数 PB以上的数据,而不必需要超级计算机和其他昂贵的专门硬件。Hadoop还能够从单台服务器扩展到数千台计算机,检测和处理应用程序层上的故障,从而提高可靠性。1、HadoopCommon:Thecommonutilitiesthatsupport
下载地址
用户评论