我有一个Dataframe (df)(例如 - 简化版本)
A B
0 2.0 3.0
1 3.0 4.0
并生成了 20 个引导重新采样,这些重新采样现在都在相同的 df 中,但重新采样编号不同。
A B
0 1 0 2.0 3.0
1 1 1 3.0 4.0
2 2 1 3.0 4.0
3 2 1 3.0 4.0
.. ..
.. ..
39 20 0 2.0 3.0
40 20 0 2.0 3.0
现在我想在每个Reample Nr上应用某个函数。说:
C = sum(df['A'] * df['B']) / sum(df['B'] ** 2)
前景如下:
A B C
0 1 0 2.0 3.0 Calculated Value X1
1 1 1 3.0 4.0 Calculated Value X1
2 2 1 3.0 4.0 Calculated Value X2
3 2 1 3.0 4.0 Calculated Value X2
.. ..
.. ..
39 20 0 2.0 3.0 Calculated Value X20
40 20 0 2.0 3.0 Calculated Value X20
所以有 20 个不同的新值。
我知道有一个 df.iloc 命令,我可以在其中指定行选择,df.iloc[row, column]但我想找到一个命令,无需为 20 个样本重复代码。我的目标是找到一个识别重新采样编号的命令。自动计算每个重新采样编号的函数。
我怎样才能做到这一点?
ITMISS
相关分类