Pandas 有多个列

首页课程实战体系课手记专栏慕课教程

Pandas 有多个列

我想选择数据框中包含列表中定义的值的所有行。我有两种方法都不能按预期/想要的那样工作。

我的数据框看起来像这样：

Timestamp DEVICE READING VALUE

1 | DEV1 | READ1 | randomvalue

2 | DEV1 | READ2 | randomvalue

3 | DEV2 | READ1 | randomvalue

4 | DEV2 | READ2 | randomvalue

5 | DEV3 | READ1 | randomvalue

我有如下列表（ls）：

[[DEV1, READ1], [DEV1, READ2], [DEV2,READ1]]

在这种情况下，我想删除行4和5：

我的第一种方法是：

df = df[(df['DEVICE']. isin([ls[i][0] for i in range(len(ls))])) &

(df['READING'].isin([ls[k][1] for k in range(len(ls))]))]

这个问题很明显，它没有删除第 4 行，因为 DEV2 有 READING READ2，但它应该删除它。

我的第二种方法是：

df = df[(df[['DEVICE','READING']].isin({'DEVICE': [ls[i][0] for i in range(len(ls))],

'READING': [ls[i][1] for i in range(len(ls))] }))]

这一行选择了正确的行，但不会删除其他行。相反，它将所有其他单元格设置为 NaN，包括我想要保留的 VALUE ROW。它不会同时累积，所以第 4 行看起来像4 |DEV2|NaN|NaN

解决这个问题的最简单或最好的方法是什么？你能帮助我吗？

HUH函数

浏览 239回答 3

3回答

MMTTMM

这应该做你想做的import pandas as pddf = pd.DataFrame({'a':[1,1,0,0,1], 'b':[0,0,1,0,1]})keepers = [[0,0],[1,1]]df = df[df.apply(lambda row: [row['a'], row['b']] in keepers, axis=1)]

0 0

随时随地看视频慕课网APP