大数据及数据挖掘实验平台
大数据的教学平台,大数据及数据挖掘实验系统,功能蛮全的,适合拿来做教学或者项目实验环境搭建。
大数据的五个 V 特性(Volume、Variety、Velocity、Value、Veracity)这系统全都照顾到了。支持的数据量挺大,PB 级没压力,适合搞点稍复杂的实验。
R 语言、Hadoop、SAS都支持,连Excel
和Java
也没落下。不论你是偏科研的,还是偏工程实现的,用这个平台都能找到合适的入口。
实验内容也比较全:数据挖掘展示、R 开发、SAS 实验、Hadoop 实验,还有一些像自然语言
、数据爬取
、数据库应用
的项目练习,日常训练和课题设计用起来都挺方便。
平台结构是服务器+学生端那种。服务器这边负责R 计算
、Hadoop 集群
,学生端就轻量一些,远程连接
和开发环境,响应也快。
对了,R 的图形功能蛮强,想画点图、跑点可视化代码完全没问题。Hadoop 那一块生态也比较成熟,要跑MapReduce
就直接上手了。
如果你正好要带学生搞点数据实验,或者自己想系统过一遍数据挖掘的实操流程,这套系统真挺适合。入门门槛不高,环境配置也比较友好。
下载地址
用户评论