我有一个columnA
整数值介于 -3 和 89 之间的 DataFrame。我想选择所有值在columnA
离散的 10 个单元箱之间的行,例如
-10 到 0
0 到 10 ...
80 到 90
我可以像这样生成每个 bin 中的行数列表:
pd.cut(DataFrame['columnA'], np.arange(-10, 100, 10), include_lowest=True, labels=False).value_counts().sort_index().to_list()
产生这样的列表:
[505, 25000, 21, 393, 79232, 953000, 24121, 662, 50, 900]
现在,如果我想检查第一个 bin 中的所有行,我可以像这样选择它们:
DataFrame.sort_values('columnA', ascending=True).iloc[0:505]
如何编写一个函数来选择 bin N 中的所有行?
慕侠2389804
一只斗牛犬
相关分类