我想通过从其余列中随机采样数据来创建一个新列。
考虑一个带有“N”列的数据框,如下所示:
|---------------------|------------------|---------------------|
| Column 1 | Column 2 | Column N |
|---------------------|------------------|---------------------|
| 0.37 | 0.8 | 0.0 |
|---------------------|------------------|---------------------|
| 0.0 | 0.0 | 0.8 |
|---------------------|------------------|---------------------|
结果数据框应该看起来像
|---------------------|------------------|---------------------|---------------|
| Column 1 | Column 2 | Column N | Sampled |
|---------------------|------------------|---------------------|---------------|
| 0.37 | 0.8 | 0.0 | 0.8 |
|---------------------|------------------|---------------------|---------------|
| 0.0 | 0.0 | B | B |
|---------------------|------------------|---------------------|---------------|
| A | 5 | 0.8 | A |
|---------------------|------------------|---------------------|---------------|
“Sampled”列的条目是通过随机选择“N”列的相应条目之一来创建的。例如,从第 2 列中选择“0.8”,从第 N 列中选择“B”,依此类推。
df.sample(axis=1)只需选择一列并返回它。这不是我想要的。
实现这一目标的最快方法是什么?该方法需要高效,因为原始数据框很大,有很多行和列。
Helenr
胡说叔叔
紫衣仙女
相关分类