-
HDFS 的 SSH 操作其实蛮实用的,是你想远程管理大数据集群的时候。它不像图形界面那样“傻瓜式”...
大小:6.88MB | -
BaiduNetdiskDownload 的资源,适合想搞大数据和机器学习的朋友,尤其是用Spark...
大小:11.54MB | -
数据的七重修炼,算是我收藏里还挺常回看的一个系列教程。内容覆盖从小白入门到商业应用的基本流程,讲得不...
大小:640.45KB | -
高级特征工程的妙用可不少,尤其是机器学习里的那些“看不见”的性能瓶颈。统计特征的构造方式挺灵活,比如...
大小:2.76MB | -
知乎的“看山杯”比赛经验贴,蛮值得一看,尤其是你对多标签文本分类感兴趣的话。这篇文章不是那种干巴巴的...
大小:2MB | -
R 语言的 K-means 聚类算法用起来还挺顺手的,语法简洁,结果也好可视化,适合你想快速试试聚类...
大小:14.93KB | -
Cloudera Manager是一款领先的大数据平台管理工具,专注于简化CDH(Cloudera'...
大小:2.61MB | -
本代码是spark学习的基础作业Wordcount ,代码简介明了,易于理解,对于初学者来说是一个很...
大小:909B | -
本文档详细简绍了,如何手动给CDH集群安装Kerberos服务的详细步骤,避免大家采坑,亲自尝试过的...
大小:14.75KB | -
最新大数据分析 ,人工智能 ,机器学习等频教程
大小:82B |