我有一个带有两个元素(id,日期)的 RDD。具有以下结构:
data=sc.textFile("/user/cloudera/dates.txt")
1,01-01-2001
2,01-02-2001
3,01-03-2001
我想将我的 RDD 转换为:
1,01/2001
2,02/2001
3,03/2001
我怎样才能做到这一点?我尝试使用地图:
data.map(lambda l: (year(l[1]) + month(l[1])))
但是没有定义年和月
MYYA
相关分类