列表的数据框列(系列)可以用作字典中的条件检查吗?
我有一列单词列表(拆分推文),我想将它们提供给词汇词典以查看它们是否都存在 - 如果不存在,我想跳过它,继续然后运行对现有单词的函数。
此代码为列中的一行生成预期结果,但是,如果我尝试将其应用于多列,则会出现“不可哈希类型列表”错误。
w2v_sum = w2v[[x for x in train['words'].values[1] if x in w2v.vocab]].sum()
使用可重现的示例进行编辑:
df = pd.DataFrame(data={'words':[['cow','bird','cat'],['red','blue','green'],['low','high','med']]})
d = {'cow':1,'bird':4,'red':1,'blue':1,'green':1,'high':6,'med':3}
所需的输出是总计(字典中的单词总和):
total words
0 5 [cow, bird, cat]
1 3 [red, blue, green]
2 9 [low, high, med]
守着一只汪
三国纷争
相关分类