我正在使用 Lucene 7.x 和 ItalianStemmer。看过ItalianStemmer类的代码,好像要花很长时间才能理解。因此,我正在寻找一种快速(可能是标准的)方式来自定义意大利语词干分析器,而不需要扩展 ItalianStemmer 或 SnowballProgram,因为我只有几天时间。
关键是我不明白为什么“saluto”(问候)这个名字来源于“sal”。它应该词干为“salut”,因为动词“salutare”(问候)词根为“salut”。而且,“sala”(房间)和“sale”(房间)也都源于“sal”,这很容易混淆,因为它们的含义不同。
开心每一天1111
相关分类