如何删除 Dataframe 中冲突的行?

我有一个分类任务,这意味着冲突会损害性能,即相同的功能但不同的标签。


idx feature label

 0     a      0

 1     a      1

 2     b      0

 3     c      1

 4     a      0

 5     b      0

我怎样才能获得如下所示的格式化数据框?


idx feature label

 2    b       0

 3    c       1

 5    b       0       

Dataframe.duplicated()只输出重复的行,看来之间的逻辑运算df["features"].duplicated()并df.duplicated()没有返回我想要的结果。


守着星空守着你
浏览 56回答 1
1回答

30秒到达战场

我认为您需要每组只有一个唯一值的行 - 因此使用GroupBy.transformwith DataFrameGroupBy.nunique、比较依据1和 过滤boolean indexing:df = df[df.groupby('feature')['label'].transform('nunique').eq(1)]print (df)   idx feature  label2    2       b      03    3       c      15    5       b      0
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python