我只想知道如何根据每一行的 id 获取最后 5 个值的总和。
df:
id values
-----------------
a 5
a 10
a 10
b 2
c 2
d 2
a 5
a 10
a 20
a 10
a 15
a 20
预期 df:
id values sum(x.tail(5))
-------------------------------------
a 5 NaN
a 10 NaN
a 10 NaN
b 2 NaN
c 2 NaN
d 2 NaN
a 5 NaN
a 10 NaN
a 20 40
a 10 55
a 15 55
a 20 60
为简单起见,我试图从仅id a 的每一行中找到最后 5 行的值的总和。
我尝试使用代码df.apply(lambda x: x.tail(5)),但只显示了整个 df 的最后一行的最后 5 行。我想从每一行中获取最后第 n 行的总和。基本上它就像时间序列数据的rolling_sum。
胡子哥哥
茅侃侃
相关分类