计算数据帧的两个单独列中的值不相等的次数百分比

我有一个包含 5 列的数据集:


0   1   2   3   4

A   Y   N   N   Y

B   N   Y   N   N

C   N   N   N   N

D   Y   Y   N   Y

E   N   Y   Y   Y

F   Y   Y   N   Y

G   Y   N   N   Y

我想计算在第 3 列和第 4 列中组合 Y 出现的时间百分比,以及在这两列组合中出现时间 N 的百分比。


我知道如何单独使用


df['3'].value_counts(normalize=True) * 100

但无法弄清楚如何将 3 和 4 结合起来。


万千封印
浏览 104回答 3
3回答

慕无忌1623718

使用 meltdf[['3','4']].melt().value.value_counts(normalize=True)Out[8]: N    0.571429Y    0.428571Name: value, dtype: float64
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java