忽略某些值对 pandas DataFrame 进行排序

3回答

冉冉说

想法是将不匹配的值替换为缺失值然后排序，最后按新索引更改顺序：idx = (df[['colA','colB']].where(df[['colA','colB']] > 0.5)           .sort_values(['colA','colB'], ascending=False).index)df1 = df.loc[idx]print (df1)   colA  colB0  0.97  0.011  0.88  0.033  0.02  0.992  0.03  0.87细节：print (df[['colA','colB']].where(df[['colA','colB']] > 0.5))   colA  colB0  0.97   NaN1  0.88   NaN2   NaN  0.873   NaN  0.99print (df[['colA','colB']].where(df[['colA','colB']] > 0.5)                          .sort_values(['colA','colB'], ascending=False))   colA  colB0  0.97   NaN1  0.88   NaN3   NaN  0.992   NaN  0.87

0 0

回首忆惘然

构建一个与“a”相同但忽略较小值的新列，并使用此新值和“b”进行排序：df.assign(simplified_a = np.where(df.colA<0.5, 0, df.colA))\  .sort_values(["simplified_a", "colB"], ascending=False).drop("simplified_a", axis=1)结果：   colA  colB0  0.97  0.011  0.88  0.033  0.02  0.992  0.03  0.87

0 0

海绵宝宝撒

根据条件过滤数据场，然后排序，然后追加df1 = df.where(df['colA'] > 0.5).sort_values('colA')df2 = df.where(df['colA'] <= 0.5).sort_values('colB')final_frame = df1.append(df2).dropna()   colA  colB0  0.87  0.011  0.88  0.032  0.03  0.873  0.02  0.99

0 0