Spark中parallelize函数和makeRDD函数的区别?

Spark中parallelize函数和makeRDD函数的区别


呼啦一阵风
浏览 1148回答 1
1回答

紫衣仙女

Spark主要提供了两种函数:parallelize和makeRDD:1)parallelize的声明:def parallelize[T: ClassTag](seq: Seq[T],numSlices: Int = defaultParallelism): RDD[T]2)makeRDD的声明:def makeRDD[T: ClassTag](seq: Seq[T],numSlices: Int = defaultParallelism): RDD[T]def makeRDD[T: ClassTag](seq: Seq[(T, Seq[String])]): RDD[T]3)区别:A)makeRDD函数比parallelize函数多提供了数据的位置信息。
打开App,查看更多内容
随时随地看视频慕课网APP