计算熊猫组内的重复值和唯一值

假设我有一个数据框:


DF1:

Class | Age | City        | Color

  A   | 20  | Los Angeles | Blue

  A   | 20  | Los Angeles | Blue

  A   | 20  | Los Angeles | Red

  B   | 25  | Phoenix     | Yellow

我想获得每个重复和唯一值的唯一计数,因此输出如下所示:


DF2:

Class | Age | City        | Color   | Count

  A   | 20  | Los Angeles | Blue    |  2

  A   | 20  | Los Angeles | Red     |  1

  B   | 25  | Phoenix     | Yellow  |  1

在这种情况下,ClassA、Age20、City洛杉矶和Color蓝色出现了两次。我试过使用,nunique但我的输出没有将重复的值折叠在一起。


df = df.groupby(['Class', 'Age', 'City', 'Color']).nunique()


哈士奇WWW
浏览 130回答 1
1回答

汪汪一只猫

你可以使用size:result = df.groupby(['Class', 'Age', 'City', 'Color']).size().reset_index(name='Count')print(result)输出  Class  Age         City   Color  Count0     A   20  Los Angeles    Blue      21     A   20  Los Angeles     Red      12     B   25      Phoenix  Yellow      1
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python