NaN 在 scikit-learn 的 OneHotEncoder 中给出 ValueError

我不知道该函数的用途，但运行代码并查看结果告诉我以下信息：您收到的 ValueError 告诉您，该函数需要数字数据 - 而不是字符串。另请注意，“handle_unknown”标志并不意味着该函数采用 None 或 nan 值，而是管理如何处理测试数据中不存在于训练数据中的类别（参见下面的示例）。以下包括未知类别的代码正在运行：import pandas as pdimport numpy as npfrom sklearn.preprocessing import OneHotEncodertrain = pd.DataFrame({        'users':[1,2,3,4],'users2':[1,2,3,4]})test = pd.DataFrame({        'users':[0,1,3,4,10],'users3':[1,2,3,4,5]})ohe = OneHotEncoder(sparse=False,handle_unknown='ignore')ohe.fit(train)train_transformed = ohe.fit_transform(train)test_transformed = ohe.transform(test)print(test_transformed)希望有帮助。替换缺失数据的工作类似于先前答案所建议的。

NaN 在 scikit-learn 的 OneHotEncoder 中给出 ValueError

2回答