我有一个看起来像这样的数据框......
ID Acuity TOTAL_ED_LOS
1 2 423
2 5 52
3 5 535
4 1 87
...
我想生成一个如下所示的表:
Acuity Count Median Percentile_25 Percentile_75 % of total
1 234 ... 31%
2 65 ... 8%
3 56 ... 7%
4 345 ... 47%
5 35 ... 5%
我已经有代码可以提供我需要的一切,除了 % of total 列
def percentile(n):
def percentile_(x):
return np.percentile(x, n)
percentile_.__name__ = 'percentile_%s' % n
return percentile_
df_grp = df_merged_v1.groupby(['Acuity'])
df_grp['TOTAL_ED_LOS'].agg(['count','median',
percentile(25), percentile(75)]).reset_index()
有没有一种有效的方法可以添加总列的百分比?下面的链接包含有关如何获取总数百分比的代码,但我不确定如何将其应用到我的代码中。我知道我可以创建两个表然后合并它们,但我很好奇是否有更简洁的方法。
如何在 Python 中计算 groupby 中的计数和百分比
海绵宝宝撒
相关分类