我已按数据集排序():DateIDdf
Date ID Start_flag End_flag
01-01-2019 100 1 0
01-02-2019 100 0 0
01-03-2019 100 0 0
01-04-2019 100 0 0
01-05-2019 100 0 1
01-09-2019 100 1 0
01-10-2019 100 0 0
01-11-2019 100 0 0
01-12-2019 100 0 0
01-03-2019 500 1 0
01-04-2019 500 0 0
01-05-2019 500 0 0
01-06-2019 500 0 0
01-07-2019 500 0 0
01-08-2019 500 0 0
01-09-2019 700 1 0
01-10-2019 700 0 0
01-11-2019 700 0 1
我想按最后一个实际值进行过滤,其中出现=1,之前所有与=1相同的数据都不应该被提取。dfDateStart_flagIDStart_flag
换句话说,如果发生几次相同的情况,则仅保留最后一次最大 。Start_flag=1IDStart_flag=1Date
预期视图为:df
Date ID Start_flag End_flag
01-09-2019 100 1 0
01-10-2019 100 0 0
01-11-2019 100 0 0
01-12-2019 100 0 0
01-03-2019 500 1 0
01-04-2019 500 0 0
01-05-2019 500 0 0
01-06-2019 500 0 0
01-07-2019 500 0 0
01-08-2019 500 0 0
01-09-2019 700 1 0
01-10-2019 700 0 0
01-11-2019 700 0 1
我试图通过 来做到这一点,但这不是正确的方法。.groupby(['ID','Start_flag'])['Date'].last()
你能帮我如何过滤额外的数据吗?谢谢df
墨色风雨
精慕HU
相关分类