Java Spark算子:sample
                                import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import java.util.Arrays; import java.util.List; /** * sample(withReplacement,fraction,seed) 算子 * 对RDD中的数据进行随机采样,会有误差。 * 第一个参数:boolean类型,表示产生的样本是否可以重复:false不重复,也就是不放回的取;t                            
                            
                            
                            
                        
                            下载地址
                        
                    
                            用户评论