pivot groupby 和 sum pandas 数据框

首页课程实战体系课手记专栏慕课教程

pivot groupby 和 sum pandas 数据框

这应该很简单，但我是使用 python 工作的新手。有什么建议吗？

#original dataframe

df = pd.DataFrame({'year':[1,1,1,1,1],

'month':[4,4,4,4,4],

'mode': ['a','b','a','a','b']},

columns=['year','month','mode'])

#pivot/groupby etc

# df2=df.pivot(columns=('year','month'), values=('mode')).count()

#create this dataframe

df2 = pd.DataFrame({'year':[1],

'month':[4],

'a': [3],

'b':[2]},

columns=['year','month','a','b'])

我在 Koalas Apache Spark 环境中工作（文档），所以解决方案应该可以解决这个问题。

眼眸繁星

浏览 167回答 2

2回答

回首忆惘然

df.pivot_table(index=['year','month'], aggfunc='size', columns='mode')

0 0

杨魅力

或者你可以使用pd.get_dummies()：pd.get_dummies(df).groupby(['year','month']).sum()结果：            mode_a  mode_byear month                1    4           3       2注意：我不确定它是否适用于 Koalas Apache Spark 环境。

0 0

随时随地看视频慕课网APP