将 .mean() 应用于具有条件的分组数据

第一个想法是替换0为NaNs 然后使用GroupBy.transformwith mean，默认情况下省略缺失值：print (df.assign(new = df['Cost'].where(df['Cost'] > 0))) Day Country Type Product Cost new0 Mon US 1 a1 0 NaN1 Mon US 2 a1 5 5.02 Mon US 3 a1 6 6.03 Mon CA 1 a1 8 8.04 Mon CA 2 a1 0 NaN5 Mon CA 3 a1 1 1.0df['Average'] = (df.assign(new = df['Cost'].where(df['Cost'] > 0)) .groupby(['Country','Product'])['new'] .transform('mean'))print (df) Day Country Type Product Cost Average0 Mon US 1 a1 0 5.51 Mon US 2 a1 5 5.52 Mon US 3 a1 6 5.53 Mon CA 1 a1 8 4.54 Mon CA 2 a1 0 4.55 Mon CA 3 a1 1 4.5或者首先过滤、聚合mean并按以下方式分配回来DataFrame.join：s = df[df["Cost"] > 0].groupby(['Country','Product'])['Cost'].mean().rename('Average')df = df.join(s, on=['Country','Product'])print (df) Day Country Type Product Cost Average0 Mon US 1 a1 0 5.51 Mon US 2 a1 5 5.52 Mon US 3 a1 6 5.53 Mon CA 1 a1 8 4.54 Mon CA 2 a1 0 4.55 Mon CA 3 a1 1 4.5

将 .mean() 应用于具有条件的分组数据

2回答