如何用测试数据集预测y值?

我已经使用下面的训练数据集成功构建了逻辑回归模型。


X = train.drop('y', axis=1)

y = train['y']


X_train, X_test, y_train, y_test = train_test_split(X, y, 

                                                    test_size=0.5)


scaler = StandardScaler()  

scaler.fit(X_train)


X_train = scaler.transform(X_train)

X_test = scaler.transform(X_test)


logreg1 = LogisticRegression()

logreg1.fit(X_train, y_train)


score = logreg1.score(X_test, y_test)

cvs = cross_val_score(logreg1, X_test, y_test, cv=5).mean()

我的问题是我想引入测试数据集来预测未知的 y 值。在测试数据中没有 y 列。如何使用单独的测试数据集预测 y 值?


蓝山帝景
浏览 249回答 1
1回答

智慧大石

使用预测():y_pred = logreg1.predict(X_test)score = logreg1.score(X_test, y_pred)print(y_pred)     // see the predictions
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python