我接触了一些需要在面向 Pandas 的处理中进行翻译的 PySpark 代码。任何帮助都会非常受欢迎,因为我正在努力寻找 Pandas 等价物的方法:
PySpark代码:
window = Window.partitionBy(df["timestamp"]).orderBy(df["timestamp"].desc())
df = df.select('*', F.rank().over(window).alias('rank')) \
.filter(F.col('rank') <= 1) \
.orderBy(df["timestamp"].desc()) \
.limit(int(window_int))
谢谢
ABOUTYOU
相关分类