learnpyspark
PySpark提供的类编辑pyspark.SparkConfpyspark.SparkConf类提供了对一个Spark应用程序配置的操作方法。用于将各种Spark参数设置为键值对。pyspark.SparkContextpyspark.SparkContext类提供了应用与Spark交互的主入口点,表示应用与Spark集群的连接,基于这个连接,应用可以在该集群上创建RDD和广播变量(pyspark.Broadcast)pyspark.SparkFilesSparkFiles只包含类方法,开发者不应创建SparkFiles类的实例[2]。pyspark.RDD这个类是为PySpark操作RDD
下载地址
用户评论