使用 Numpy 将包含 Groupby 和 Count 参数的列添加到数据框中

我需要将一列添加到包含按其他三列分组的行数的数据框中。


手头的桌子长这个样子


 Index   Col0    Col1    Col2    Col3


  01      a1     '1'     '2'    '1'

  02      a2     '1'     '2'    '2'

  02      a3     '1'     '2'    '2'

  04      a4     '1'     '2'    '2'

  05      a5     '1'     '2'    '2'

  06      a6     '2'     '2'    '2'

我需要按 Col1、Col2 和 Col3 分组,然后计数。所需的结果应如下所示:


Index   Col0    Col1    Col2    Col3   Col4

 01      a1     '1'     '2'    '1'     1

 02      a2     '1'     '2'    '2'     4

 02      a3     '1'     '2'    '2'     4

 04      a4     '1'     '2'    '2'     4

 05      a5     '1'     '2'    '2'     4

 06      a6     '2'     '2'    '2'     1

谢谢大家。


守着一只汪
浏览 261回答 1
1回答

三国纷争

用:df['col4']=df.groupby(['Col1','Col2','Col3']).transform('count').values[:,0]我认为你在你想要的输出中有一个错字,如果你想要逻辑,它必须是:   Index Col0  Col1  Col2  Col3  col40      1   a1     1     2     1     11      2   a2     1     2     2     42      2   a3     1     2     2     43      4   a4     1     2     2     44      5   a5     1     2     2     45      6   a6     2     2     2     1
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python