我有一个数据框 df
df:
GROUP VALUE
1 5
2 2
1 10
2 20
1 7
还有一个功能
import numpy as np
from scipy import stats
def z_score(x):
z = np.abs(stats.zscore(x))
c = np.where(x > 5, 1, 0)
return z,c
我试图在函数输出和熊猫变换方法的帮助下在数据框中创建两列
df['zscore'], df['label'] = a.groupby(['GROUP'])['VALUE'].transform(z_score)
但是在运行上述代码段后出现以下错误
ValueError: Length of passed values is 2, index implies 3
如何实现这一目标?
繁星coding
相关分类