我有以下数据框,其中每条记录都填充了 D 或 E。从来没有。以下是数据框 df,其中包含 4 月(当前)和 3 月 2 个月的虚拟记录。(最初数据将有 12 个月,B 列的值重复出现)
我正在寻找: 1. groupby 列 A 为四月份总和(D 列)/总和(E 列)
df.groupby(['A', 'C']).df.D/df.E.sum().rolling(1, min_periods=1).mean()
或者尝试过,
def divide_two_cols(df):
return df['D'].sum() / df['E'].sum()
df.groupby(['A', 'C']).divide_two_cols(df).sum().rolling(1, min_periods=1).sum()
同样适用于过去两个月(三月和四月)
df.groupby(['A', 'C']).df.D/df.E.sum().rolling(2, min_periods=1).mean()
关于为什么这两种方法都无法使用其他两列的总和来形成新列的任何建议。
郎朗坤
相关分类