Java与Hadoop的数据序列化
数据序列化是将结构化对象转化为字节流的过程,而反序列化则是序列化的逆过程,将字节流转回结构化对象。在Java中,序列化通过使用java.io.Serializable接口来实现。Hadoop作为一个大数据处理框架,也具有自己的序列化特点,采用了Writable格式。这种序列化格式具有紧凑、快速、可扩展、互操作的特点。紧凑性指它高效使用存储空间,快速性表示读写数据的额外开销小,可扩展性允许透明地读取老格式的数据,而互操作性支持多语言的交互。
下载地址
用户评论