是否有可能与蟒蛇熊猫进行模糊匹配?
我有两个DataFrame,我想根据一个列合并它们。然而,由于交替拼写,不同的空格数目,没有/存在的指示符号,我希望能够合并,只要它们是相似的另一个。
任何相似算法都可以(Soundex,Levenshtein,Difflib)。
假设一个DataFrame具有以下数据:
df1 = DataFrame([[1],[2],[3],[4],[5]], index=['one','two','three','four','five'], columns=['number'])
number
one 1
two 2
three 3
four 4
five 5
df2 = DataFrame([['a'],['b'],['c'],['d'],['e']], index=['one','too','three','fours','five'], columns=['letter'])
letter
one a
too b
three c
fours d
five e
然后我想要得到最终的DataFrame
number letter
one 1 a
two 2 b
three 3 c
four 4 d
five 5 e
鸿蒙传说
翻过高山走不出你
相关分类