在 FuzzyWuzzy 比率描述中,它说:
FuzzyWuzzy ratio raw score 是 [0, 100] 范围内的 int 字符串相似性的度量。对于两个字符串 X 和 Y,分数由 int(round((2.0 * M / T) * 100)) 定义,其中 T 是两个字符串中的字符总数,M 是两个字符串中的匹配数. FuzzyWuzzy 比率模拟分数是 [0, 1] 范围内的浮点数,通过将原始分数除以 100 获得。
那为什么我改变单词的顺序时这个分数看起来不同呢?
from fuzzywuzzy import fuzz
fuzz.ratio('EMRE MERT', 'OMER CAN') / 100 = 0.35
fuzz.ratio('EMRE MERT', 'CAN OMER') / 100 = 0.47
拉风的咖菲猫
相关分类