一种更好的变长字符串相似度排序算法
我正在寻找一种字符串相似度算法,它可以在变长字符串上产生比通常建议的更好的结果(levenshtein距离,soundex等)。
例如,
鉴于字符串A:“罗伯特”,
然后是字符串B:“Amy Robertson”
会比一个更好的比赛
字符串C:“理查德”
此外,优选地,该算法应该是语言不可知的(也可以用于除英语之外的语言)。
相关分类