我想从hdfs位置读取一堆文本文件,并使用spark在迭代中对其执行映射。
JavaRDD<String> records = ctx.textFile(args[1], 1); 一次只能读取一个文件。
我想读取多个文件并将它们作为单个RDD处理。怎么样?
繁星点点滴滴
12345678_0001
相关分类