1. 首页
  2. 数据库
  3. 其它
  4. Uber开源Marmaray:基于Hadoop的通用数据摄取和分散框架

Uber开源Marmaray:基于Hadoop的通用数据摄取和分散框架

上传者: 2021-01-31 21:33:15上传 PDF文件 703KB 热度 9次
三年前,Uber采用ApacheHadoop作为数据平台,从而可以跨计算机集群管理数PB的数据。但是,因为我们有很多团队、工具和数据源,所以需要一种可靠的方式来摄取和分散数据。Marmaray是Uber开源的Apache Hadoop数据提取和分散框架。Marmaray由我们的Hadoop平台团队设计和开发,是一个建立在Hadoop生态系统之上的基于插件的框架。用户可以新增插件以便从任何来源摄取数据,并利用Apache Spark将数据分散到接收器上。Marmaray这个名
下载地址
用户评论