热编码 wrt 到引用(列的最后一个按字典顺序排序的元素)

我的专栏看起来像这样:


df = pd.DataFrame({

          'A':['a','b','a','c','b','d','a']

        })

   A

0  a

1  b

2  a

3  c

4  b

5  d

6  a

我需要按字典顺序对列进行排序,然后开始热编码过程,但我必须将该列的最后一个值作为参考(应映射到全零的向量)并将它们替换为“A”列。


喜欢:


a = [1 0 0] 

b = [0 1 0]

c = [0 0 1]

d = [0 0 0]

最终结果应该是这样的


   A

0  [1 0 0] 

1  [0 1 0]

2  [1 0 0] 

3  [0 0 1]

4  [0 1 0]

5  [0 0 0]

6  [1 0 0] 


米琪卡哇伊
浏览 101回答 1
1回答

GCT1015

尝试用get_dummiesdf['A'] = df.A.str.get_dummies().drop('d', axis=1).to_numpy().tolist()dfOut[237]:            A0  [1, 0, 0]1  [0, 1, 0]2  [1, 0, 0]3  [0, 0, 1]4  [0, 1, 0]5  [0, 0, 0]6  [1, 0, 0]
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python