我很难找到一种方法来重塑多索引(列)df 两种方式:(a) 除了一列之外,多索引的两个级别都被熔化了
(b) 每一个 0 级柱都熔化了 1 级柱
我可能已经发现 (a) 尽管可能不是最程序化的方式并且可以接近但没有雪茄 (b)
例如,给定 DataFrame:
df = pd.DataFrame({'dealer': {0: 'SF', 1: 'LA'},
'col2': {0: 1, 1: 3},
'col3': {0: 2, 1: 4},
'col4': {0: 3, 1: 6},
'col5': {0: 7, 1: 2},
})
df.columns = [['Jan','Jan','Feb','Feb','dealer'], ['cars','trucks','cars','trucks','dealer']]
Out[209]:
Jan Feb dealer
cars trucks cars trucks dealer
0 1 2 3 7 SF
1 3 4 6 2 LA
我可以通过以下方式到达 (a):
melted = df.melt(id_vars = 'dealer',col_level=0, var_name='month')
melted['product']=df.melt(id_vars = 'dealer',col_level=1)['variable']
melted.sort_values('dealer', inplace=True)
melted
Out[211]:
dealer month value product
1 LA Jan 3 cars
3 LA Jan 4 trucks
5 LA Feb 6 cars
7 LA Feb 2 trucks
0 SF Jan 1 cars
2 SF Jan 2 trucks
4 SF Feb 3 cars
6 SF Feb 7 trucks
但似乎无法正确旋转以将 ['dealer','product','Jan','Feb'] 作为列标签,其中值在 Jan 和 Feb cols
pivotedd = pd.DataFrame({'dealer': {0: 'LA', 1: 'LA',2: 'SF', 3: 'SF'},
'product': {0: 'cars', 1: 'trucks',2: 'cars', 3: 'trucks'},
'Jan': {0: 3, 1: 4,2:1,3:2},
'Feb': {0: 6, 1: 2,2:3,3:7},
})
Out[215]:
Feb Jan dealer product
0 6 3 LA cars
1 2 4 LA trucks
2 3 1 SF cars
3 7 2 SF trucks
显然,我希望经销商和产品作为按时间顺序排列的第一列和日期(还没有阅读为什么 pd.dataframe 更改您输入数据的顺序),但这基本上是我所追求的。
紫衣仙女
相关分类