我有一个数据框,其中包含用户、操作和用户执行操作的时间。如果操作同时满足两个条件,我想将它们分组到一个列表中: 1. 同一用户执行的操作 2. 操作在 20 分钟内执行。
目前我正在尝试使用 timedelta 来计算迭代的时间差并阅读这篇文章,但这不是我想要的。我很难找到类似的例子。
数据框有数千行,这是其中的一部分
user action time
A browse 2018-07-01 06:00:00
A edit 2018-07-01 06:10:00
B signin 2018-07-01 06:00:00
B browse 2018-07-01 06:11:00
B edit 2018-07-01 07:00:00
预期输出将是满足条件的操作列表
output
[[browse, edit], [signin, browse]]
用户 B 所做的最后一次“编辑”不在其中,因为 (07:00:00) - (06:11:00) > 20 分钟
有关如何执行此操作的任何建议?非常感谢您的先进!
相关分类