猿问

PySpark Pandas:Groupby 识别列并将两个不同的列相加以创建新的 2x2 表

我有以下示例数据集:


groupby prevoius    current

A       1           1

A       0           1

A       0           0

A       1           0

A       1           1

A       0           1

我想通过对“上一个”和“当前”列求和来创建下表。


previous_total   current_total

3                4

我已经尝试了 groupby 与 .agg 的所有组合并尝试实现上面的表格,但无法成功运行任何东西。


我也知道如何在 Python Pandas 中执行此操作,但不知道如何在 Pyspark 中执行此操作。


守候你守候我
浏览 251回答 2
微课
2回答
随时随地看视频慕课网APP

相关分类

Python
我要回答