BaiduNetdisk Spark机器学习资源合集
BaiduNetdiskDownload 的资源,适合想搞大数据和机器学习的朋友,尤其是用Spark和Python做数据挖掘的。
Spark 的内存计算,挺适合做需要反复训练的模型,比如聚类、回归那类的,响应快,效率也高。比起 MapReduce 那种写个模型要读写好几次硬盘,真的轻松不少。
资源里有些干货 PDF 和 PPT,比如那个光环国际 spark 大数据机器学习 PPT,内容讲得挺实在的,不会太学术,适合快速入门。
还有一些实战资料,像Python 机器学习实战
那份,对接 Spark 也讲了,代码直接拿来跑一跑就能上手。
如果你最近在搞机器学习项目,或者想换个比 Hadoop MapReduce 更快的工具,那可以把这些都下下来看看,选几个练手的 demo 搞搞。
下载地址
用户评论