保存 sklearn 管道的中间结果

我们可以分配get_params()给一个应该返回类型对象的变量sklearn.decomposition.pca.PCA。有了这个，我们就可以访问分解的所有方法和属性。from sklearn.datasets import load_breast_cancerimport numpy as npimport pandas as pdfrom sklearn.decomposition import FastICA, PCAfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.pipeline import Pipelinefrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import classification_reportfrom sklearn.metrics import confusion_matrix#Convert the dataset to data framecancer = load_breast_cancer()     data = np.c_[cancer.data, cancer.target]columns = np.append(cancer.feature_names, ["target"])df = pd.DataFrame(data, columns=columns)#Split data into train and test X = df.iloc[:, 0:30].valuesY = df.iloc[:, 30].valuesX_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.25, random_state = 0)#Create a pipeline n_comp = 12clf = Pipeline([('pca', PCA(n_comp)), ('RandomForest', RandomForestClassifier(n_estimators=100))])clf.fit(X_train, Y_train)### --- ###pca = clf.get_params()['pca']type(pca)#sklearn.decomposition.pca.PCApca.explained_variance_ratio_#array([9.81327198e-01, 1.67333696e-02, 1.73934848e-03, 1.05758996e-04,#       8.29268494e-05, 6.34081771e-06, 3.75309113e-06, 7.08990845e-07,#       3.16742542e-07, 1.75055859e-07, 7.11274270e-08, 1.43003803e-08])pca.components_.shape#(12, 30)希望这可以帮助。

保存 sklearn 管道的中间结果

1回答