我想对列重新排序并选择我想要的列。
例如,如果列名称为A、B、C和D。
我知道简单的方法是:
# Python
df = df[['D', 'C', 'A', 'B']]
但是,如果有多个列,比如一百多个变量,这种方法就很糟糕了。我找到了这个问题的答案。
# Python
cols_to_order = ['D', 'C']
new_columns = cols_to_order + (df.columns.drop(cols_to_order).tolist())
df= df[new_columns]
但上面的做法并不是很灵活。
在 中R,使用subset()是同时对列进行重新排序和子集化的不错选择。
# R
df = subset(df, select = c(4, 3 , 1, 2))
如果列很多,我们还可以使用subset()重新排序和删除:
# R
# Multiple columns
# Drop columns 51 to 54
df = subset(df, select = c(4, 3 , 1:2, 5:50, 55:100))
有类似的功能吗Python?
繁华开满天机
相关分类