将预测值与其索引/识别号相关联

我正在训练一个模型来根据一些数据预测真假。在训练和测试模型时,我从功能列表中删除了产品编号。


X = df.drop(columns = 'Product Number', axis = 1)

y = df['result']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 42)


SVC = LinearSVC(max_iter = 1200)

SVC.fit(X_train, y_train)

y_pred = SVC.predict(X_test)

我有什么办法可以恢复已通过或未通过的项目的产品编号及其功能吗?如何获取 y_pred 的结果/将其与其对应的产品编号关联起来?


我还计划使用交叉验证,以便对数据进行洗牌,我还有办法恢复每个测试项目的产品编号吗?


慕丝7291255
浏览 115回答 1
1回答

守候你守候我

我意识到我使用交叉验证只是为了评估模型的性能,因此我决定只运行代码,而不重新整理数据以查看每个数据点的结果。编辑:对于没有交叉验证的评估,只有当我将其传递给分类器时,我才会删除不相关的列,如下所示:cols = ['id', 'label']X = train_data.copy()y = train_data['label']X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=2)knn = make_pipeline(StandardScaler(),KNeighborsClassifier(n_neighbors=10))y_val_pred = knn.fit(X_train.drop(columns=cols), y_train).predict(X_val.drop(columns=cols))X_val['y_val_pred'] = y_val_pred我加入y_val_pred后预测来检查哪些数据点被错误分类。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python