猿问

如何根据包含所需顺序的预定义数组对pandas数据帧的值进行排序?

df = pd.DataFrame({'id': [1, 2, 3, 4, 5],

 'p1': [0, 0, 1, 1, 2],

 'p2': [9, 2, 3, 5, 3],

 'p3': [1, 3, 10, 3, 7],

 'p4': [4, 4, 7, 1, 10]})


df = df.set_index('id')

df


    p1  p2  p3  p4

id                

1    0   9   1   4


2    0   2   3   4


3    1   3  10   7


4    1   5   3   1


5    2   3   7  10

现在假设我有一个数据框,其中包含 df 数据帧的每个元素所需的行顺序位置。例如,比如说,


 order=np.argsort(-df.values,axis=1)


order

array([[1, 3, 2, 0],  

       [3, 2, 1, 0],  

       [2, 3, 1, 0],  

       [1, 2, 0, 3],  

       [3, 2, 1, 0]], dtype=int64)

如何根据 order 数组的元素对 df 数据帧元素进行排序?


期望的结果是


    p1  p2  p3  p4

id                

1    9   4   1   0

2    4   3   2   0

3   10   7   3   1

4    5   3   1   1

5   10   7   3   2


慕容708150
浏览 119回答 2
2回答

偶然的你

您可以使用通过numpy.take_along_axis提供的“花哨”索引来创建数据数组,然后重新创建整个 DataFrame。pd.DataFrame(np.take_along_axis(df.to_numpy(), order, axis=1),             index=df.index,             columns=df.columns)    p1  p2  p3  p4id                1    9   4   1   02    4   3   2   03   10   7   3   14    5   3   1   15   10   7   3   2

慕标琳琳

创建一个如下所示的映射器,然后您可以执行以下操作:mapper={0:'p1',1:'p2',2:'p3',3:'p4'}df_copy=df.copy()for index, row in df.iterrows():    i=0    for name, values in row.iteritems():        df[name][index]=df_copy[mapper[order[index-1][i]]][index]        i=i+1
随时随地看视频慕课网APP

相关分类

Python
我要回答