所以我用MultiIndex创建一个数据框
df = pd.DataFrame({
'C1': ['x', 'x', 'y', 'y', 'z', 'z'],
'C2': ['a', 'b', 'a', 'b', 'a', 'b'],
'C3': [10, 11, 12, 13, 14, 15]})
df.set_index(['C1', 'C2'], inplace=True)
我得到以下数据框
C3
C1 C2
x a 10
b 11
y a 12
b 13
z a 14
b 15
我也有一个具有相同索引的系列C2:
series = pd.Series([100], index=['a'])
我想将此系列分配给一个新列C4,仅分配给“ x”第一个索引。如果使用.assign,它会工作,但会返回一个副本:
df.loc['x'].assign(C4=series)
我得到
C3 C4
C2
a 10 100.0
b 11 NaN
但我无法将其分配给原始数据
df.loc['x'] = df.loc['x'].assign(C4=series)
产量
C3
C1 C2
x a NaN
b NaN
如果使用这样的赋值,我将得到相同的结果:
df.loc['x', 'C4'] = series
但是它会产生NaN。
C3 C4
C1 C2
x a NaN NaN
b NaN NaN
y a 12.0 NaN
b 13.0 NaN
z a 14.0 NaN
b 15.0 NaN
如何以这种方式分配?
慕仙森
饮歌长啸
相关分类