熊猫将列添加到时间序列上的数据框聚合

当你进行聚合和unstacked( df.groupby(['client','year']).agg({'Amount': ['sum']}).unstack())时，列的值year已经展开成列，这些列就是一个MultiIndex。您可以通过以下方式查看：print (df1.columns)然后你可以选择它们。使用多索引列因此，要选择与 2020 匹配的列，您可以使用：df1.loc[:,df1.columns.get_level_values(2).isin({2020})您可能可以获得正确的列，然后使用以下方法检查 2020 是否具有非零值：df1['nb2020'] = df1.loc[:,df1.columns.get_level_values('year').isin({2020})] > 0如果您想要 1 和 0（而不是 bool 类型），您可以转换为 int（使用astype）。重命名列如果您认为这有点复杂，您可能还希望将列更改为单个索引。使用类似的东西df1.columns = df1.columns.get_level_values('year')或者df1.columns = df1.columns.get_level_values(2)进而df1['nb2020'] = (df1[2020] > 0).astype(int)

熊猫将列添加到时间序列上的数据框聚合

1回答