猿问

删除PythonPandas中的所有重复行

删除PythonPandas中的所有重复行

这个pandas drop_duplicates功能是伟大的“独特”的数据。但是,要传递的关键字参数之一是take_last=Truetake_last=False,而我希望删除跨列子集重复的所有行。这个是可能的吗?

    A   B   C0   foo 0   A1   foo 1   A2   foo 1   B3   bar 1   A

例如,我希望删除列上匹配的行。AC因此,这应该删除行0和1。


收到一只叮咚
浏览 2716回答 3
3回答

交互式爱情

这对熊猫来说要容易得多滴式重复以及保持参数。import pandas as pd df = pd.DataFrame({"A":["foo", "foo", "foo", "bar"], "B":[0,1,1,1], "C":["A","A","B","A"]})df.drop_duplicates(subset=['A', 'C'], keep=False)

Smart猫小萌

只是想补充一下本的答案滴式重复:keep{“第一”、“最后”、“假}”、默认“第一”第一:除去第一次出现的重复。最后一次:除最后一次事件外,删除重复项。假:删除所有副本。如此设定keep对于假的,我们给你想要的答案。如果删除重复行,则返回DataFrame(*args,*kwargs),可选地只考虑某些列参数:子集:列标签或标签序列,可选只考虑某些列用于识别重复项,默认情况下使用所有列保持:{‘第一’,‘最后’,假},默认‘第一:删除重复除了第一次出现。最后一次:除最后一次事件外,删除重复项。假:删除所有副本。get_lastated inplace:boole,默认为false,无论是删除重复的还是返回副本cols:kwargs只包含子集的参数[取消推荐的]返回:depliced:dataFrame

慕勒3428872

如果希望将结果存储在另一个数据集中:df.drop_duplicates(keep=False)或df.drop_duplicates(keep=False, inplace=False)如果需要更新相同的数据集:df.drop_duplicates(keep=False, inplace=True)以上示例将删除所有重复项并保留一个副本,类似于DISTINCT *在SQL中
随时随地看视频慕课网APP

相关分类

Python
我要回答