Python数据表（或pandas）：基于两列的数据框的棘手排序

3回答

拉风的咖菲猫

这是您要找的吗：>>> from datatable import dt, f, sort, ifelse>>> df1 = dt.Frame(C1=['a', 'a', 'b', 'c'],                    C2=['b', 'c', 'a', 'a'],                    Values=[5, 10, 15, 20])>>> df1[:, :, sort(ifelse(f.C1<f.C2, f.C1, f.C2),                    ifelse(f.C1<f.C2, f.C2, f.C1))]   | C1  C2  Values-- + --  --  ------ 0 | a   b        5 1 | b   a       15 2 | a   c       10 3 | c   a       20[4 rows x 3 columns]这里我们按 2 个计算列对框架进行排序，第一个是 C1 和 C2 中的最小值，第二个是 C1 和 C2 中的最大值。

0 0

繁花不似锦

尝试这个：import pandas as pdC1 = ['a', 'a', 'b', 'c']C2 = ['b', 'c', 'a', 'a']Values = [5, 10, 15, 20]df = pd.DataFrame({'C1': C1, 'C2': C2, 'Values': Values})srt = df.apply(lambda x: ','.join(sorted(x[['C1', 'C2']].values)),axis=1)df.loc[srt.argsort(),:]

0 0

汪汪一只猫

转换为后pandas，我们可以sort_values尝试numpy.sortimport numpy as np df1 = df1.to_pandas()out = df1.iloc[pd.DataFrame(np.sort(df1.values,1)).sort_values([0,1]).index]Out[54]:   C1 C20  a  b2  b  a1  a  c3  c  a

0 0