pivot groupby 和 sum pandas 数据框

这应该很简单,但我是使用 python 工作的新手。有什么建议吗?


#original dataframe

df = pd.DataFrame({'year':[1,1,1,1,1],

                   'month':[4,4,4,4,4],

                   'mode': ['a','b','a','a','b']},

                  columns=['year','month','mode'])


#pivot/groupby etc

# df2=df.pivot(columns=('year','month'), values=('mode')).count()


#create this dataframe

df2 = pd.DataFrame({'year':[1],

                   'month':[4],

                   'a': [3],

                   'b':[2]},

                  columns=['year','month','a','b'])

我在 Koalas Apache Spark 环境中工作(文档),所以解决方案应该可以解决这个问题。


眼眸繁星
浏览 102回答 2
2回答

回首忆惘然

df.pivot_table(index=['year','month'], aggfunc='size', columns='mode')

杨魅力

或者你可以使用pd.get_dummies():pd.get_dummies(df).groupby(['year','month']).sum()结果:            mode_a  mode_byear month                1    4           3       2注意:我不确定它是否适用于 Koalas Apache Spark 环境。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python