我有一个 ~2M 个字符串的列表和一个 ~800 个单词的列表。我创建了一个数据框,其中字符串作为行,单词作为列。除了字符串变量之外,所有其他变量都是真值或假值,对应于单词是否在字符串中。没有缺失值。
IE
import pandas as pd
df = pd.DataFrame({'strings':['a string with california',
'a string with lobster',
'a str with california and lobster'],
'california':[True,False,True],
'lobster':[False,True,True],
'string':[True,True,False],})
因为数据框太长太宽而无法一次查看,我想要一个变量来列出具有该特定行真实值的列名。例如,
df_filtered = pd.DataFrame({'strings':['a string with california',
'a string with lobster',
'a str with california and lobster'],
'matches':[['string','california'],
['string', 'lobster'],
['california', 'lobster']],
'california':[True,False,True],
'lobster':[False,True,True],
'string':[True,True,False],})
我是 Pandas 的新手,并且发现我可以使用以下命令创建一个包含缺失值的列名列表
columns_w_na = df.columns[df.isnull().any()].tolist()
有没有一种方法可以为每一行类似地捕获具有特定值的列的名称并将其表示为列表?
收到一只叮咚
米琪卡哇伊
RISEBY
相关分类