我有一些令人费解的操作,试图使用以下一般形式在数据集上有效完成:
id,date,ind_1,ind_2,ind_3,ind_4
1,2014-01-01,ind_1,NaN,NaN,NaN
2,2014-01-02,ind_1,NaN,ind_3,NaN
3,2014-01-03,ind_1,ind_2,ind_3,NaN
我试图弄清楚如何创建一个新列“ ind_all”,该列将填充任何非空“ ind”列。这很简单。我可以使用.idxmax()。但是,棘手的部分是我每行可以有多个“ ind”。这意味着当有重复项时,我需要创建一个新记录。上面的示例最终应该看起来像这样:
id,date,ind_1,ind_2,ind_3,ind_4,ind_all
1,2014-01-01,ind_1,NaN,NaN,NaN,ind_1
2,2014-01-02,ind_1,NaN,ind_3,NaN,ind_1
2,2014-01-02,ind_1,NaN,ind_3,NaN,ind_3
3,2014-01-03,ind_1,ind_2,ind_3,NaN,ind_1
3,2014-01-03,ind_1,ind_2,ind_3,NaN,ind_2
3,2014-01-03,ind_1,ind_2,ind_3,NaN,ind_3
一如既往的技巧或窍门,一如既往地受到赞赏!
相关分类