目标:获取 df 的每一列和每个客户的缺失值百分比
我的 df 是关于创建的票证:
id type ... priority Client
0 56 113 Incident ... Low client1
1 56 267 Demande ... High client1
2 56 294 Incident ... Nan NaN
3 56 197 Demande ... Low client3
4 56 143 Demande ... Nan client4
第一次尝试 :
df.notna().sum()/len(agg_global)*100
Out[29]:
id 97.053453
type 76.415869
priority 82.626625
client 84.596443
这非常有用,但我想在我的输出中添加更多详细信息,在列中使用“客户端”维度,如下所示:
我想创建的输出:
Client1 Client2 Client3 NaN
id 100.000000 100.000000 100.000000 66.990424
type 76.415869 66.990424 76.415869 43.761970
status 100.000000 100.000000 66.990424 76.415869
category 66.990424 43.761970 76.415869 43.761970
entity 43.761970 100.000000 76.415869 76.415869
source_demande 84.596443 100.000000 76.415869 43.761970
我尝试使用“groupby”但无法获得所需的输出...:
id type ... priority Client
client ...
True 97.053453 76.415869 ... 29.98632 29.98632
任何建议将被认真考虑。感谢您的关注 !
一只斗牛犬
撒科打诨
相关分类