我有以下示例数据集:
groupby prevoius current
A 1 1
A 0 1
A 0 0
A 1 0
我想通过对“上一个”和“当前”列求和来创建下表。
previous_total current_total
3 4
我已经尝试了 groupby 与 .agg 的所有组合并尝试实现上面的表格,但无法成功运行任何东西。
我也知道如何在 Python Pandas 中执行此操作,但不知道如何在 Pyspark 中执行此操作。
相关分类