我正在尝试预处理一些数据以用于机器学习目的。我目前正在尝试清理一些 NaN 值,并将它们替换为“未知”和基于列名称的前缀或后缀。
原因是当我使用一种热编码时,我不能将多个具有相同名称的列输入到 xgboost 中。
所以我有以下内容
df = df.apply(lambda x: x.replace(np.nan, 'unknown'))
我想用“unknown_columname”替换 df 中 NaN 的所有实例。有没有简单或简单的方法可以做到这一点?
喵喵时光机
呼啦一阵风
红糖糍粑
随时随地看视频慕课网APP
相关分类