使用 spark 我为每个组(队列)聚合数据以仅包含平均值、标准差和方差。
现在在使用 python 的第二步中,我想测试正常性(https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.normaltest.html),然后使用 t-测试stats.ttest_ind
或stats.wilcoxon
等级测试。
然而,所有这些方法都期望数据作为原始的面向记录的值输入。如何将它们与预先聚合的数据一起使用?
炎炎设计
相关分类