我基本上有一个带有邮政编码的列和另一个带有社区的列,并且我有一些空值要填充在邮政编码列上。所以首先我找到了对应于缺失的邮政编码的社区。其次,我找出了那个街区最常见的邮政编码。
下面是一些邻域X的邮政编码。这个特定邻域的模式是,假设是Y。我想做的是,取邻域列下有邻域X的行,填充相应的邮政编码列其中值为空。
这是邻域 X 的模式。它返回实际模式 (BS8) 和包含有关邻域 X 的所有邮政编码的完整列表
<bound method Series.mode of 25 BS8
1904 BS1
1919 BS8
2070 BS1
2083 BS1
2099 NaN
2105 BS1
2228 NaN
2256 BS1
2265 BS8
2285 BS8
2298 BS8
因此,在这种情况下,我想用最常见的邮政编码类型HH填写邮政编码下的南值。
neighbourhood Postcode
WH BS9
SB BS9
HF BS9
WH BS9
WH BS9
SB BS9
HH nan
SGTH nan
如果 HH 最常见的邮政编码是 Z,如果想填写相应的邮政编码,如下所示:
neighbourhood Postcode
WH BS9
SB BS9
HF BS9
WH BS9
WH BS9
SB BS9
HH Z
SGTH nan
在网上查看后,我尝试了类似下面的代码,但没有用。
airbnb.postcode = airbnb.apply(
lambda row: "BS8 " if (airbnb.neighbourhood=="HH" & airbnb.postcode== np.NaN) else row.postcode )
相关分类