猿问

删除 Pandas 中的重复行(可能按组)

我有数据集 df,其中包含以下数据:


starttime               endtime              ID  Diff  

1/10/2020 9:05:00 PM    1/10/2020 9:05:10    A    10

1/10/2020 9:05:00 PM    1/10/2020 9:05:10    A    10

1/10/2020 9:06:00 PM    1/10/2020 9:06:10    B    10

期望的结果:


starttime               endtime              ID Diff

1/10/2020 9:05:00 PM    1/10/2020 9:05:10    A  10

1/10/2020 9:06:00 PM    1/10/2020 9:06:10    B  10

如果您注意到,A 组中的一行已被删除,因为它是完全重复的:


1/10/2020 9:05:00 pm    1/10/2020 9:05:10    A   10

这是我正在使用的代码,但是,我不确定括号中包含什么,或者这是否正确:


df.drop_duplicates(subset=None, keep=False)

任何建议表示赞赏。


芜湖不芜
浏览 129回答 2
2回答

撒科打诨

尝试查看文档。如果您无法确定最适合您的情况,请再次询问,并提供上下文(例如示例)。该链接适用于熊猫 0.25https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html

守着星空守着你

您可以提供列df.drop_duplicates(subset='ID', keep=False)
随时随地看视频慕课网APP

相关分类

Python
我要回答