将预测值与其索引/识别号相关联

我意识到我使用交叉验证只是为了评估模型的性能，因此我决定只运行代码，而不重新整理数据以查看每个数据点的结果。编辑：对于没有交叉验证的评估，只有当我将其传递给分类器时，我才会删除不相关的列，如下所示：cols = ['id', 'label']X = train_data.copy()y = train_data['label']X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=2)knn = make_pipeline(StandardScaler(),KNeighborsClassifier(n_neighbors=10))y_val_pred = knn.fit(X_train.drop(columns=cols), y_train).predict(X_val.drop(columns=cols))X_val['y_val_pred'] = y_val_pred我加入y_val_pred后预测来检查哪些数据点被错误分类。

将预测值与其索引/识别号相关联

1回答