NaN导致sklearn模型无法运行

我有一个数据集,我正在尝试使用sklearn进行逻辑回归,但是该数据集具有NaN,这会引起问题。我在网上看到的大多数问题都是关于填补缺失值的问题。但是,我对输入缺失值感到不舒服。有没有办法删除数据框中的所有NaN值,或仅包括所有列中都没有NaN的行?

我最终创建了一个新的数据框,只保留所有列中都有答案的行。

df2 = df1[(df1['var1']>=0) & (df1['var2']>=0) & (df1['var3']>=0)]

但是,如果我有100列,该怎么办。最佳和最简单的方法是什么?


繁花如伊
浏览 198回答 2
2回答

慕工程0101907

删除至少一个条目为NaN的行:df2 = df1.dropna(axis=0, how='any')请注意,以上参数值是默认值,但我还是将它们包括在内,只是为了使其更加清晰。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python