我有 2 个数据框。df1 有 39780 行,df2 有 8900454 行
我要合并的 df1 列: ['postalcode','housenumber', 'suffix']
“后缀”列包含一些 NAN。
df2 列:
['postalcode_right','housenumber_right', 'suffix_right', 'index_right']
(名为“index_right”的列不是该数据框的索引。)
df2 = pd.merge(df1, df2, how='left', left_on=['postalcode','housenumber', 'suffix'], right_on = ['postalcode_right','housenumber_right', 'suffix_right'])
因为 df1.suffix 包含 NAN 右边的一些行匹配左边的多行。
如何防止这种情况或清除多次匹配的行的“index_right”值?
qq_笑_17
相关分类