不需要标签的一次性编码？

我认为您可能将多类（您的情况）与多输出分类混淆了。在多类分类问题中，您的输出应该只是一个目标列，您将训练模型在该列的类之间进行分类。您必须拆分为单独的目标列，如果您必须预测每个样本的n不同类别，但事实并非如此，您只需要每个样本的一个目标。因此对于多类分类，不需要对目标进行 OneHotEncode，因为您只需要一个目标列（在 SVC 中也可以是分类的）。您必须OneHotEncoder使用或与其他一些编码器一起编码的是分类输入特征，它必须是数字。此外，SVC可以处理分类目标，因为它LabelEncode是内部的：from sklearn.datasets import load_irisfrom sklearn.svm import SVCfrom sklearn.model_selection import train_test_splitX, y = load_iris(return_X_y=True)X_train, X_test, y_train, y_test = train_test_split(X, y)y_train_categorical = load_iris()['target_names'][y_train]# array(['setosa', 'setosa', 'versicolor',...sv = SVC()sv.fit(X_train, y_train_categorical)sv.classes_# array(['setosa', 'versicolor', 'virginica'], dtype='<U10')

不需要标签的一次性编码？

2回答