猿问

具有 nan 值的 Imputer.fit 有什么作用?

我正在使用 scikit-learn 库学习机器学习,当我看到Scikit-learn 教程中的代码时感到困惑


它有以下代码:


import numpy as np

from sklearn.impute import SimpleImputer

imp = SimpleImputer(missing_values=np.nan, strategy='mean')

imp.fit([[1, 2], [np.nan, 3], [7, 6]])       


X = [[np.nan, 2], [6, np.nan], [7, 6]]

print(imp.transform(X)) 

据我了解, imputer 用于填充缺失值,并且它使用了一些策略,如均值、中位数或众数。但我不明白这3行代码在做什么


imp.fit([[1, 2], [np.nan, 3], [7, 6]])       

X = [[np.nan, 2], [6, np.nan], [7, 6]]

print(imp.transform(X)) 

为什么它适合矩阵np.nan?以及这些拟合如何影响imp.transform(X)?


30秒到达战场
浏览 124回答 1
1回答
随时随地看视频慕课网APP

相关分类

Python
我要回答