我有一个巨大的 df 看起来像这样 -
... || City || Country
Newyork USA
Newyork USA
Newyork USA
Newyork **unknown**
delhi india
delhi **unknown**
delhi india
现在,我想根据已匹配的城市用正确的国家/地区填充未知数。例如,大多数带有 newyork 的行在 country 列中都是 USA。
我的想法是按国家/地区分组并将其转换为字典以进行映射,但这种方法失败了。
这是一个类似的问题,但解决方案是在 R 中: 根据发生概率填充缺失值
PIPIONE
相关分类