我是数据科学和 scikit-learn 的新手,所以如果这是一个基本问题,我深表歉意。当我们想在新数据集上训练时,是否需要创建 sklearn 类的新实例?例如,我目前正在做:
transformer = PowerTransformer()
transformed1 = transformer.fit_transform(data1.to_numpy())
transformer = PowerTransformer()
transformed2 = transformer.fit_transform(data2.to_numpy())
...
我要转换多组数据以便运行KNNImputer(再次使用这种重复声明方法)。
我读到该.fit方法在内部存储它用于适应传入数据的 lambda,但是存储的 lambda 是否会在每次调用时被覆盖,.fit或者它们是否会受到适合新数据的影响?
这样做是错误的吗:
transformer = PowerTransformer()
transformed1 = transformer.fit_transform(data1.to_numpy())
transformed2 = transformer.fit_transform(data2.to_numpy())
...
先感谢您!
慕哥9229398
相关分类