如何通过聚合从组中删除 Pandas 中的嵌套列名？

您可以简单地重命名列：import numpy as npimport pandas as pdnp.random.seed(2018)df = pd.DataFrame(np.random.randint(10, size=(100, 3)), columns=['A','B','C'])result = df.groupby('A').agg({'B': [('D','count'),('E','nunique')],                              'C': [('F','first'),('G','max')]})result.columns = result.columns.get_level_values(1)print(result)或者，您可以保存groupby对象，并用于grouped[col].agg(...) 生成子数据帧，然后可以将其pd.concat组合在一起：import numpy as npimport pandas as pdnp.random.seed(2018)df = pd.DataFrame(np.random.randint(10, size=(100, 3)), columns=['A','B','C'])grouped = df.groupby('A')result = pd.concat([grouped['B'].agg([('D','count'),('E','nunique')]),                    grouped['C'].agg([('F','first'),('G','max')])], axis=1)print(result)两个代码片段都产生以下结果（尽管列的顺序可能不同）：    D  E  F  GA             0  18  8  8  91  12  8  6  62  14  8  0  83  10  9  8  94   7  6  3  55   8  5  6  76   9  7  9  97   8  6  4  78   8  7  2  99   6  5  7  9总的来说，我认为事后重命名列是最简单、更易读的选择。

如何通过聚合从组中删除 Pandas 中的嵌套列名？

1回答