我有以下几点df:
df =
year intensity category
2015 22 1
2015 21 1
2015 23 2
2016 25 2
2017 20 1
2017 21 1
2017 20 3
我需要分组year并计算平均值intensity和最频繁category(每年)。
我知道可以按如下方式计算最常见的类别:
df.groupby('year')['category'].agg(lambda x: x.value_counts().index[0])
我也知道如何计算平均值intensity:
df = df.groupby(["year"]).agg({'intensity':'mean'}).reset_index()
但我不知道如何在没有join操作的情况下把所有东西放在一起。
相关分类