使用 Pandas 更改列数据

假设 df 看起来像：df：    Col-a   Col-b   Col-c0   val1    abc    val11   val2    bca    bca2   NaN     bca    zzs3   val2    NaN    val24   val3    xyz    zzs  使用pd.factorize()以及格式会给我们：  df_new=pd.DataFrame({'Col-a':['Col-a{}'.format(i) for i in list(pd.factorize(df['Col-a'])[0])],'Col-b':df['Col-b'].values.tolist(),'Col-c':['Col-c{}'.format(i) for i in list(pd.factorize(df['Col-c'])[0])]})>>df_new    Col-a   Col-b   Col-c0   Col-a0  abc     Col-c01   Col-a1  bca     Col-c12   Col-a-1 bca     Col-c23   Col-a1  NaN     Col-c34   Col-a2  xyz     Col-c2需要注意的是pd.factorize对待NaN作为-1默认情况下，因此该行2列，一个具有-1。因此，如果需要，您可以在执行上述代码之前将它们删除。希望这可以帮助。

使用 Pandas 更改列数据

1回答