是否有任何方法可以使用 python 代码将值转换为列名并将它们标记为 1 或 0,如下面的示例所示?
hobbytable 在爱好列中有值,但有些单元格有多个值,用“/”分隔。为了使用多元回归模型或其他模型,数据集的形状会更好,低于预期结果。
共享示例代码以解决此问题将不胜感激。
爱好表(CSV 文件)
personID, hobby
x1234, baseball/soccer
y1234, reading/baseball
z1234, null
a1234, soccer
作为 DataFrame 的预期结果
personID, baseball, soccer, reading, soccer
x1234, 1, 1, 0, 0
y1234, 1, 0, 1, 0
z1234, 0, 0, 0, 0
a1234, 0, 1, 0, 0
胡子哥哥
米琪卡哇伊
猛跑小猪
相关分类