在 pandas 数据框中 - 返回满足条件的累积和的最后一个值

index [0, 1, 2, 3, 4, 5]

part_1 [4, 5, 6, 4, 8, 4]

part_2 [11, 12, 10, 12, 14, 13]

new [6, 4, 8, 8, na, na]

我是 python 和 pandas 的初学者,寻求支持。在一个简单的数据框中,我想创建一个新列,为我提供满足条件的累积总和的最后一行


df.part_1.cumsum() > df.part_2

例如,对于索引 0 处的新列,我将得到值 6,即 (4+5+6) > 11。


谢谢!


慕容森
浏览 124回答 1
1回答

qq_花开花谢_0

IIUC 这里有一个NumPy基于方法。这个想法是构建一个上三角矩阵,每行中都有输入数组的移位版本。通过获取这些的累积和,并与数据帧的第二列进行比较,我们可以使用argmax第一个索引找到累积序列中的值大于相应索引中的第三数据帧列:a = df.to_numpy()cs = np.triu(a[:,1]).cumsum(1)ix = (cs >= a[:,2,None]).argmax(1)# array([2, 3, 3, 4, 6, 7, 7, 0], dtype=int64)df['first_ix'] = a[ix,1,None]print(df)   index  part_1  part_2  first_ix0      0       4      11         61      1       5      12         42      2       6      10         43      3       4      12         84      4       8      14         65      5       4      13         86      6       6      11         87      7       8      10         4
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python