我有数据集 df,其中包含以下数据:
starttime endtime ID Diff
1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10
1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10
1/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10
期望的结果:
starttime endtime ID Diff
1/10/2020 9:05:00 PM 1/10/2020 9:05:10 A 10
1/10/2020 9:06:00 PM 1/10/2020 9:06:10 B 10
如果您注意到,A 组中的一行已被删除,因为它是完全重复的:
1/10/2020 9:05:00 pm 1/10/2020 9:05:10 A 10
这是我正在使用的代码,但是,我不确定括号中包含什么,或者这是否正确:
df.drop_duplicates(subset=None, keep=False)
任何建议表示赞赏。
撒科打诨
守着星空守着你
相关分类