我在 java 中使用 apache spark,我想做的是过滤一些数据,按特定键对其进行分组,然后计算每个键的元素数量。目前我正在这样做:
Dataset<MyBean> rawEvents = readData(spark);
Dataset<MyBean> filtered = rawEvents.filter((FilterFunction<MyBean>) events ->
//filter function
));
KeyValueGroupedDataset<String, MyBean> grouped = filtered
.groupByKey((MapFunction<MyBean, String>) event -> {
return event.getKey();
}, Encoders.STRING());
grouped.count().write().parquet("output.parquet");
它无法写入,因为:org.apache.spark.sql.AnalysisException: Attribute name "count(1)" contains invalid character(s) among " ,;{}()\n\t=". Please use alias to rename it.;
我怎样才能为计数列起别名,以免发生这种情况?
明月笑刀无情
吃鸡游戏
相关分类