慕雪6442864
从Python 3.6开始,Python的标准库就有了解决方案,即random.choices。用法示例:让我们设置一个与OP问题匹配的总体和权重:>>> from random import choices>>> population = [1, 2, 3, 4, 5, 6]>>> weights = [0.1, 0.05, 0.05, 0.2, 0.4, 0.2]现在choices(population, weights)生成一个样本:>>> choices(population, weights)4可选的仅关键字参数k允许一次请求多个样本。这很有价值,因为random.choices在生成任何样本之前,每次调用时都需要做一些准备工作; 通过一次生成许多样本,我们只需要做一次准备工作。在这里,我们生成了一百万个样本,并用于collections.Counter检查我们得到的分布大致与我们给出的权重相匹配。>>> million_samples = choices(population, weights, k=10**6)>>> from collections import Counter>>> Counter(million_samples)Counter({5: 399616, 6: 200387, 4: 200117, 1: 99636, 3: 50219, 2: 50025})