删除 Pandas 中的重复行（可能按组）

我有数据集 df，其中包含以下数据：

starttime endtime ID Diff

1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10

1/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10

期望的结果：

starttime endtime ID Diff

1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10

1/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10

如果您注意到，A 组中的一行已被删除，因为它是完全重复的：

1/10/2020 9:05:00 pm 1/10/2020 9:05:10 A 10

这是我正在使用的代码，但是，我不确定括号中包含什么，或者这是否正确：

df.drop_duplicates(subset=None, keep=False)

任何建议表示赞赏。

芜湖不芜

浏览 209回答 2

2回答

撒科打诨

尝试查看文档。如果您无法确定最适合您的情况，请再次询问，并提供上下文（例如示例）。该链接适用于熊猫 0.25https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop_duplicates.html

守着星空守着你

您可以提供列df.drop_duplicates(subset='ID', keep=False)

随时随地看视频慕课网APP