我需要Year, Month, Day, Hour从 Spark df 中的列中获取字符串Time。我还需要将这些值保存在单独的列中。数据如下:
ID Time
111 2020-03-23-12:40:04
112 2020-04-23-12:40:04
113 2020-05-23-12:40:04
期望的输出是:
ID Year Month Day
111 2020 03 23
112 2020 04 23
113 2020 05 23
我试过:
data_df.select(
year("Time").alias('year'),
month("Time").alias('month'),
dayofmonth("Time").alias('day')
).show()
它返回所有 Null 值。
UYOU
相关分类