如何在比最初训练的原始数据集特征更少的数据集上使用标准缩放器模型

我使用的是 sklearn.preprocessing 中的标准标量模型。我在包含 27 个特征的数据集上安装了标准缩放器模型。是否可以在包含少于 27 个特征的测试数据集上使用相同的标准标量模型代码片段

from sklearn.preprocessing import StandardScaler()
sc=StandardScaler()
sc.fit_transform(x_train)

到目前为止,一切正常。当我尝试转换测试数据集时,出现了问题。我知道为什么会这样。测试数据集有 24 个特征。但是是否有可能转换仅有的 24 个特征并忽略其中不存在的那些列。

sc.transform(x_test)

提前致谢!!


慕桂英3389331
浏览 59回答 1
1回答

慕标5832272

如果想选择所有功能而没有第一个3功能,请使用DataFrame.iloc:from sklearn.preprocessing import StandardScalersc = StandardScaler()x_train.iloc[:, 3:] = sc.fit_transform(x_train.iloc[:, 3:])print (x_train)如果功能在列表中使用subset:from sklearn.preprocessing import StandardScalersc = StandardScaler()features = ['col1','col2',..., 'col24']x_train[features] = sc.fit_transform(x_train[features])print (x_train)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python