从 df 中查找重复行。

df = 


Name    Age City

Jack    34  Sydney

Riti    30  Delhi

Aadi    16  New York

Riti    30  Delhi

Riti    30  Delhi

Riti    30  Mumbai

Aadi    40  London

Sachin  30  Delhi

df[df.duplicated(keep='last')]

上面的代码给出了重复的列表。但是我需要的是,如果包含至少1个重复项,那么它应该返回。dfThe df contains duplicate rows


开满天机
浏览 191回答 2
2回答

富国沪深

您可以使用 :any>>> df     Name  Age     City0    Jack   34   Sydney1    Riti   30    Delhi2    Aadi   16  NewYork3    Riti   30    Delhi4    Riti   30    Delhi5    Riti   30   Mumbai6    Aadi   40   London7  Sachin   30    Delhi>>> df.duplicated().any()True>>> 'The df contains duplicates' if df.duplicated().any() else 'no duplicates' 'The df contains duplicates'

人到中年有点甜

duplicated 实际上返回一个 Series,其中包含每行的布尔值。如果该行具有重复项,则返回的序列中的相应行具有“True”值。因此,您可以执行以下操作:df.duplicated().any()如果数据帧中存在任何重复项,它将返回 True。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python