猿问

如何在不删除 NaN 值的情况下删除 pandas 中的重复项

我有一个要查询的数据框,我只想从特定列中获取唯一值。
我试图执行此代码:

    database = pd.read_csv(db_file, sep='\t')
    query = database.loc[database[db_specifications[0]].isin(elements)].drop_duplicates(subset=db_specification[1])

db_specification只是一个包含我查询的两列的列表。
有些值是NaN,我不想将它们视为彼此重复,我该如何实现?


弑天下
浏览 132回答 1
1回答

噜噜哒

您可以先选择全部NaN,然后将副本放在数据框的其余部分。mask = data.isna().any() data = pd.concat([data[mask], data[~mask]])
随时随地看视频慕课网APP

相关分类

Python
我要回答