猿问

DataFrame中的时间计算和动作分组

我有一个数据框,其中包含用户、操作和用户执行操作的时间。如果操作同时满足两个条件,我想将它们分组到一个列表中: 1. 同一用户执行的操作 2. 操作在 20 分钟内执行。


目前我正在尝试使用 timedelta 来计算迭代的时间差并阅读这篇文章,但这不是我想要的。我很难找到类似的例子。


数据框有数千行,这是其中的一部分


user    action      time

A       browse      2018-07-01 06:00:00

A       edit        2018-07-01 06:10:00

B       signin      2018-07-01 06:00:00

B       browse      2018-07-01 06:11:00

B       edit        2018-07-01 07:00:00

预期输出将是满足条件的操作列表


output

[[browse, edit], [signin, browse]]

用户 B 所做的最后一次“编辑”不在其中,因为 (07:00:00) - (06:11:00) > 20 分钟


有关如何执行此操作的任何建议?非常感谢您的先进!


繁花不似锦
浏览 169回答 1
1回答
随时随地看视频慕课网APP

相关分类

Python
我要回答