分解 JavaPairRDD 对象

我有一个JavaPairRDD<Dimension, Metrics>,这里Dimension&Metrics对象有一堆成员。有没有办法将其转换为Dataset<Row>两个对象的所有列/成员。或者还有一种方法可以将其转储JavaPairRDD到一个文件中,其中两个对象的列/成员由制表符或逗号分隔。



尚方宝剑之说
浏览 94回答 1
1回答

德玛西亚99

您可以使用map()转换将 JavaPairRDD 转换为 JavaRDD,将维度和指标中的所有成员表示为逗号分隔的字符串。在此之后,您可以将其保存为文本文件。这样做的逻辑步骤:覆盖 Dimension 和 Metrics 类中的 toString() 。您可以在其中将逗号分隔的值列表作为字符串返回。在您的火花应用程序中 -Function<Tuple2<Dimension, Metrics>, String> f = tuple -> (tuple._1.toString() +"," + tuple._2.toString());JavaRDD csvRdd = pairRDD.map(f);csvRdd.saveAsTextFile("your file path")
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java