这是我必须均匀随机选择 30 个数据点的代码。让我困惑的部分是我们为什么要检查if random.random() <= p?谁能解释一下?
from sklearn import datasets
import random
iris = datasets.load_iris()
d = iris.data
# sample 30 points uniform randomly from 150 points dataset
n = 150
m = 30
p = m/n
lst = []
for i in range(0, n):
if random.random() <= p:
lst.append(d[i,:])
猛跑小猪
相关分类