PythonNLTKpos_tag不返回正确的语音标记

PythonNLTKpos_tag不返回正确的语音标记

有此:

text = word_tokenize("The quick brown fox jumps over the lazy dog")

和跑步:

nltk.pos_tag(text)

我得到:

[('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', 'NN'), ('dog', 'NN')]

这是不正确的。标记quick brown lazy在这句话中应该是:

('quick', 'JJ'), ('brown', 'JJ') , ('lazy', 'JJ')

通过他们的在线工具给出了相同的结果;quickbrownfox应该是形容词而不是名词。


qq_遁去的一_1
浏览 1077回答 2
2回答
打开App,查看更多内容
随时随地看视频慕课网APP