Java中的模糊字符串搜索库

我正在寻找一个用于模糊字符串搜索的高性能Java库。


有许多算法可以找到类似的字符串,Levenshtein距离,Daitch-Mokotoff Soundex,n-gram等。


存在哪些Java实现?他们的利弊?我知道Lucene,任何其他解决方案或Lucene最好吗?


我找到了这些,有没有人有过这些经历?


幕布斯6054654
浏览 685回答 3
3回答

HUH函数

Commons Lang实施了Levenshtein距离。Commons Codec有soundex和metaphone的实现。

陪伴而非守候

如果你主要比较短字符串并想要一些便携和轻量级的东西,你可以使用众所周知的python算法fuzzywuzzy 移植到Java。你可以在这里阅读更多相关信息
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Java