我有一个DataFrame,在希望分组的列中有许多缺失值:
import pandas as pd
import numpy as np
df = pd.DataFrame({'a': ['1', '2', '3'], 'b': ['4', np.NaN, '6']})
In [4]: df.groupby('b').groups
Out[4]: {'4': [0], '6': [2]}
看到Pandas删除了具有NaN目标值的行。(我想包括这些行!)
由于我需要许多这样的操作(许多col具有缺失的值),并且除了中位数(通常是随机森林)之外,还使用更复杂的函数,因此我想避免编写过于复杂的代码。
有什么建议么?我应该为此编写一个函数还是有一个简单的解决方案?
有只小跳蛙
慕桂英3389331
相关分类