Pyspark - 计算每个数据框列中空值的数量

我有一个包含许多列的数据框。我的目标是生成一个列出每个列名称的数据框,以及该列中空值的数量。


例子:


+-------------+-------------+

| Column_Name | NULL_Values |

+-------------+-------------+

|  Column_1   |      15     |

|  Column_2   |      56     |

|  Column_3   |      18     |

|     ...     |     ...     |

+-------------+-------------+

我已经设法获得一列的空值数量,如下所示:


df.agg(F.count(F.when(F.isnull(c), c)).alias('NULL_Count'))

其中c是数据框中的一列。但是,它不显示列的名称。输出是:


+------------+

| NULL_Count |

+------------+

|     15     |

+------------+

有任何想法吗?


胡子哥哥
浏览 191回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python