如何删除 Dataframe 中冲突的行？

我有一个分类任务，这意味着冲突会损害性能，即相同的功能但不同的标签。

idx feature label

0 a 0

1 a 1

2 b 0

3 c 1

4 a 0

5 b 0

我怎样才能获得如下所示的格式化数据框？

idx feature label

2 b 0

3 c 1

5 b 0

Dataframe.duplicated()只输出重复的行，看来之间的逻辑运算df["features"].duplicated()并df.duplicated()没有返回我想要的结果。

守着星空守着你

浏览 255回答 1

1回答

30秒到达战场

我认为您需要每组只有一个唯一值的行 - 因此使用GroupBy.transformwith DataFrameGroupBy.nunique、比较依据1和过滤boolean indexing：df = df[df.groupby('feature')['label'].transform('nunique').eq(1)]print (df) idx feature label2 2 b 03 3 c 15 5 b 0

随时随地看视频慕课网APP