我有两个组(A和B)的数据框,在这些组中,有 6 个子组(、、、、、a和)。示例数据如下:bcdef
index group subgroup value
0 A a 1
1 A b 1
2 A c 1
3 A d 1
4 A e 1
5 A f 1
6 B a 1
7 B b 1
8 B c 1
9 B d 1
10 B e 1
11 B f 1
... ... ... ...
虽然我在这里只列出了 12 行等于 1 的值,但实际上真实数据集中有 300 行(值等于 2、3 等)。我正在尝试将数据框随机分成 6 批,每批 50 个值。但是,我希望每批包含均匀分布的group值(因此 25 个 A 和 25 个 B)和大致均匀分布的subgroup值。
例如,batch_1 可能包含:
25 A's,其中包含 4 a's、5 b's、4 c's、4 d's、5 e's 和 3 f's。和 25 B's,其中包含 5 a's、4 b's、3 c's、5 d's、4 e's 和 4 f's。
这 6 个批次将分配给 1 个用户。(所以我实际上需要将数据帧随机拆分为多个不同的6 个批次以供更多用户使用。)但我无法判断这是否是数据帧应该随机拆分或采样的问题。有没有人对如何实现这一目标有建议?
喵喔喔
相关分类