1. 首页
  2. 数据库
  3. 其它
  4. 大数据开发实战:SparkStreaming流计算开发

大数据开发实战:SparkStreaming流计算开发

上传者: 2021-01-31 03:04:17上传 PDF文件 216.45KB 热度 12次
Storm以及离线数据平台的MapReduce和Hive构成了Hadoop生态对实时和离线数据处理的一套完整处理解决方案。除了此套解决方案之外,还有一种非常流行的而且完整的离线和实时数据处理方案。这种方案就是Spark。Spark本质上是对Hadoop特别是MapReduce的补充、优化和完善,尤其是数据处理速度、易用性、迭代计算和复杂数据分析等方面。SparkStreaming作为Spark整体解决方案中实时数据处理部分,本质上仍然是基于Spark的弹性分布式数据集(Resilient DistributedDatasets
下载地址
用户评论