我对逻辑回归进行了网格搜索,并将评分设置为“roc_auc”。grid_clf1.best_score_ 给了我 0.7557 的 auc。之后我想绘制最佳模型的 ROC 曲线。我看到的 ROC 曲线的 AUC 为 0.50 我根本不明白这一点。
我查看了预测的概率,发现它们都是 0.0 或 1.0。因此,我认为这里出了点问题,但我找不到它是什么。
我的网格搜索cv代码如下:
clf1 = Pipeline([('RS', RobustScaler()), ('LR',
LogisticRegression(random_state=1, solver='saga'))])
params = {'LR__C': np.logspace(-3, 0, 5),
'LR__penalty': ['l1']}
grid_clf1 = GridSearchCV(clf1, params, scoring='roc_auc', cv = 5,
n_jobs=-1)
grid_clf1.fit(X_train, y_train)
grid_clf1.best_estimator_
grid_clf1.best_score_
所以这给出了最佳模型的 AUC 为 0.7557。然后,如果我自己计算模型的 AUC:
y_pred_proba = grid_clf1.best_estimator_.predict_probas(X_test)[::,1]
print(roc_auc_score(y_test, y_pred_proba))
这给了我 0.50 的 AUC。
动漫人物
相关分类