我是新来的火花。我想对CSV记录中的特定数据执行一些操作。
我正在尝试读取CSV文件并将其转换为RDD。我的进一步操作基于CSV文件中提供的标题。
(摘自评论)到目前为止,这是我的代码:
final JavaRDD<String> File = sc.textFile(Filename).cache();
final JavaRDD<String> lines = File.flatMap(new FlatMapFunction<String, String>() {
@Override public Iterable<String> call(String s) {
return Arrays.asList(EOL.split(s));
}
});
final String heading=lines.first().toString();
我可以获得这样的标题值。我想将此映射到CSV文件中的每个记录。
final String[] header=heading.split(" ");
我可以获得这样的标题值。我想将此映射到CSV文件中的每个记录。
在Java中,我CSVReader record.getColumnValue(Column header)用来获取特定值。我需要做类似这里的事情。
哆啦的时光机