猿问

Dataframes python 删除重复项

我有一个看起来像这样的数据框


  TaskID Status         Time         

0    123   Progress     12.00

1    234   Progress     12.10

2    123   Almost Done  12.20

3    234   Completed    12.40

我需要使用最新记录更新记录的状态而不更改其他列的值并删除最新的重复记录。


最后结果


   TaskID Status         Time         

0    123   Almost Done  12.00

1    234   Completed    12.10

我怎样才能做到这一点?谢谢。


芜湖不芜
浏览 171回答 1
1回答

繁星淼淼

我相信您需要agg使用first和 聚合last:df = df.groupby('TaskID', as_index=False).agg({'Status':'last','Time':'first'})print (df)   TaskID       Status  Time0     123  Almost Done  12.01     234    Completed  12.1
随时随地看视频慕课网APP

相关分类

Python
我要回答