如何获得具有指定条件的列的平均值？

您可以mean尝试cumcount：df.assign(mean = df[["a", "b"]].mean(axis=1))\  .assign(mean = df["mean"].subtract(df.groupby("mean").cumcount().divide(10)))输出#    Name  Sum  a  b  mean# 0  hamm   34  2  2   2.0# 1   jam   54  1  1   1.0# 2   tan   36  3  1   1.9# 3   pan   39  4  4   4.0说明：使用计算平均值mean。我们指定axis=1在行上计算它。对于每一个相同mean的，我们要减去n*0.1。我们使用groupby相同的分组所有行mean我们使用cumcount. 有关更多详细信息，请参阅此讨论。除以10使用divide以将计数器转换为0.1, 0.2, ...使用从步骤 2 中减去输出到mean列subtract完整代码+插图# Step 1df["mean"] = df[["a", "b"]].mean(axis=1)print(df)#    Name  Sum  a  b  mean# 0  hamm   34  2  2   2.0# 1   jam   54  1  1   1.0# 2   tan   36  3  1   2.0# 3   pan   39  4  4   4.0# Step 2.1 + 2.2print(df.groupby("mean").cumcount())# 0    0# 1    0# 2    1# 3    0# dtype: int64# Step 2.3print(df.groupby("mean").cumcount().divide(10))# 0    0.0# 1    0.0# 2    0.1# 3    0.0# dtype: float64# Step 3df["mean"] = df["mean"].subtract(df.groupby("mean").cumcount().divide(10))print(df)#    Name  Sum  a  b  mean# 0  hamm   34  2  2   2.0# 1   jam   54  1  1   1.0# 2   tan   36  3  1   1.9# 3   pan   39  4  4   4.0

如何获得具有指定条件的列的平均值？

1回答