有没有办法在熊猫的两列中找到重复数据删除?

两列 pandas 中的重复数据删除。pandas 中的数据可能放错了位置,有些是空值。


Person    Name1        Name2  

0          Jet         NaN 

1          Edward      Lach  

2          NaN         Jet

3          Lach        Edward

为 Name1 和 Name2 生成列表并查看它们是否存在。有没有更好的方法来做到这一点?


set1,set2 = list(df["Name1"]),list(df["Name2"])




Expected

Person    SurName    FirstName  

0          Jet         NaN  

1          Edward      Lach


犯罪嫌疑人X
浏览 117回答 1
1回答

人到中年有点甜

使用numpy.sortwith 替换缺失值DataFrame.fillna,为可能的调用创建 DataFrame 构造函数,DataFrame.duplicated并boolean indexing使用反向掩码 by过滤~:mask = (pd.DataFrame(np.sort(df[['Name1','Name2']].fillna('missing'), axis=1), index=df.index)          .duplicated())df = df[~mask]print (df)   Person   Name1 Name20       0     Jet   NaN1       1  Edward  Lach
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python