在 pandas 数据透视表中运行总和(python)

我有一个如下所示的数据框:


df = pd.DataFrame({'publisher': ['facebook', 'facebook', 'facebook', 'google', 'google', 'google'],

          'month_leadgen': ['2019-01', '2019-01', '2019-01', '2019-02', '2019-02', '2019-03'],

         'month_payment': ['2019-01', '2019-02', '2019-03', '2019-02', '2019-03', '2019-03'],

         'revenue': [60, 25, 45, 85, 90, 60]})

我创建了一个数据透视表:


df = df.pivot_table(index=['publisher', 'month_leadgen'], columns=['month_payment'], values=['revenue']).reset_index()


    publisher   month_leadgen   revenue

month_payment            2019-01  2019-02  2019-03

0   facebook    2019-01  60.0     25.0     45.0

1   google      2019-02  NaN      85.0     90.0

2   google      2019-03  NaN      NaN      60.0

我的预期输出是按月汇总总和。因此,对于 facebook,我希望在 2019-02 列(第 1 个月 + 第 2 个月)中看到 85.0。Facebook 的 2019-03 栏将为 125.0(第 1 个月 + 第 2 个月 + 第 3 个月)。谢谢。


慕哥6287543
浏览 160回答 2
2回答

料青山看我应如是

让我们试试.cumsum()axis=1。那就是cumsum(1)。df=df.join(df[['revenue']].cumsum(1).rename(columns=dict(revenue='Cumsum')))publisher month_leadgen                     revenue                  Cumsum          \month_payment                         2019-01 2019-02 2019-03   2019-01 2019-02   0              facebook       2019-01    60.0    25.0    45.0    60.0    85.0   1                google       2019-02     NaN    85.0    90.0     NaN    85.0   2                google       2019-03     NaN     NaN    60.0     NaN     NaN                          month_payment 2019-03  0               130.0  1               175.0  2                60.0  或者,在枢轴阶段进行;df2 = df=df.pivot_table(index=['month_leadgen','publisher'], columns=['month_payment'], values=['revenue']).cumsum(axis=1).reset_index()

Smart猫小萌

只需以这种方式定义您的数据集,并将发布者作为索引:df = pd.DataFrame( { 'month_leadgen': ['2019-01', '2019-01', '2019-01', '2019-02', '2019-02', '2019-03'], '月付款': ['2019-01', '2019-02', '2019-03', '2019-02', '2019-03', '2019-03'], '收入': [60, 25, 45, 85, 90, 60] }, 索引 = ['facebook', 'facebook', 'facebook', 'google', 'google', 'google'] )然后执行执行这一行:df['TotalShifted'] = df.groupby(level=0)['收入'].transform(lambda x: x.cumsum().shift(0))您将获得:Month_leadgen Month_ payment 收入 TotalShifted facebook 2019-01 2019-01 60 60 facebook 2019-01 2019-02 25 85 facebook 2019-01 2019-03 45 130 google 2019-02 2019-02 85 85 google 2019-02 201 9-03 90 175 谷歌2019年3月 2019年3月 60 235
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python