我有一个DF,如下所示:
DF =
id token argument1 argument2
1 Tza Tuvia Tza Moscow
2 perugia umbria perugia
3 associated the associated press Nelson
我现在要比较的列的值argumentX,并token与选择新列的值ARG相应。
DF =
id token argument1 argument2 ARG
1 Tza Tuvia Tza Moscow ARG1
2 perugia umbria perugia ARG2
3 associated the associated press Nelson ARG1
这是我尝试过的:
conditions = [
(DF["token"] == (DF["Argument1"])),
DF["token"] == (DF["Argument2"])]
choices = ["ARG1", "ARG2"]
DF["ARG"] = np.select(conditions, choices, default=nan)
这只会比较整个String,如果匹配则匹配。结构,如.isin,.contains或使用辅助列如DF["ARG_cat"] = DF.apply(lambda row: row['token'] in row['argument2'],axis=1)没有工作。有任何想法吗?
达令说
相关分类