猿问

熊猫:根据子集在另一个数据框中查找重复项

假设 DF 1:


   A  B  C

0  1  1  1

1  1  1  2

2  2  1  1

3  1  9  0

4  9  9  9

和东风 2


   A  B  C

0  6  1  1

1  1  1  2

2  2  1  1

3  1  9  0

4  1  9  6

我想在 DF 1 中添加一列,其中包含基于列子集的 DF 2 中的重复项计数:


例如


复制于


1

2

结果:


   A  B  C  Dupe

0  1  1  1   1

1  1  1  2   1

2  2  1  1   1

3  1  9  0   2

4  9  9  9   0


哆啦的时光机
浏览 97回答 1
1回答

心有法竹

听起来你应该groupby通过 df2mergedf=df1.merge(df2.groupby(['A','B']).size().to_frame('DUP').reset_index(),how='left').fillna(0)   A  B  C  DUP0  1  1  1  1.01  1  1  2  1.02  2  1  1  1.03  1  9  0  2.04  9  9  9  0.0
随时随地看视频慕课网APP

相关分类

Python
我要回答