我正在尝试按字符串中是否有单词来过滤数据框,我尝试了以下方法:
text="Abacus and androgeny and for"
tokenized = tknzr.tokenize(text.lower())
pattern= "|".join(tokenized)
lexicon = lexicon[lexicon["English (en)"].str.match(pattern, na = False)]
这实际上不起作用,因为以“for”开头的单词(如伪造)会匹配。为了清楚起见,我只需要与文本中的某个单词完全匹配的行。
牧羊人nacy
相关分类