从 df 中查找重复行。

首页课程实战体系课手记专栏慕课教程

从 df 中查找重复行。

df =

Name Age City

Jack 34 Sydney

Riti 30 Delhi

Aadi 16 New York

Riti 30 Delhi

Riti 30 Mumbai

Aadi 40 London

Sachin 30 Delhi

df[df.duplicated(keep='last')]

上面的代码给出了重复的列表。但是我需要的是，如果包含至少1个重复项，那么它应该返回。dfThe df contains duplicate rows

开满天机

浏览 288回答 2

2回答

富国沪深

您可以使用：any>>> df     Name  Age     City0    Jack   34   Sydney1    Riti   30    Delhi2    Aadi   16  NewYork3    Riti   30    Delhi4    Riti   30    Delhi5    Riti   30   Mumbai6    Aadi   40   London7  Sachin   30    Delhi>>> df.duplicated().any()True>>> 'The df contains duplicates' if df.duplicated().any() else 'no duplicates' 'The df contains duplicates'

0 0

人到中年有点甜

duplicated 实际上返回一个 Series，其中包含每行的布尔值。如果该行具有重复项，则返回的序列中的相应行具有“True”值。因此，您可以执行以下操作：df.duplicated().any()如果数据帧中存在任何重复项，它将返回 True。

0 0

随时随地看视频慕课网APP