匹配 2 个数据框的熊猫列值

我将首先在df_ads以下位置创建另一列：# If `df_mapping['CODE']` is `int`df_ads['CODE'] = df_ads['ad_post_code'].apply(lambda x: int(x[:4]))# If `df_mapping['CODE']` is `str`# df_ads['CODE'] = df_ads['ad_post_code'].apply(lambda x: x[:4])然后我将DataFrame.merge用来执行两个数据帧的内部合并：df_ads.merge(df_mapping, left_on='CODE', right_on='CODE', how='inner')我冒昧地修改您的数据以生成一个可行的示例：# df_ads['ad_post_code']0    1567 JA1    3893 GB2    5091 BE3    1087 MB4    7905 GW5    5121 ZH6    1011 XX# df_mapping   CODE NUTS_30  1011  NL3261  1012  NL3262  1013  NL3263  1014  NL3264  1015  NL3265  1016  NL3266  1567  XSFDF输出：  ad_post_code  CODE NUTS_30      1567 JA  1567  XSFDF1      1011 XX  1011  NL326如果每个代码都df_ads['CODE']存在，df_mapping['CODE']那么你应该得到正确的输出。编辑如果你想知道列表中的df_mapping是否完整，你可以这样做：df_ads.loc[np.logical_not(df_ads['CODE'].isin(df_mapping['CODE']))]缺失数据：   ad_post_code  CODEid                   1       3893 GB  38932       5091 BE  50913       1087 MB  10874       7905 GW  79055       5121 ZH  5121

匹配 2 个数据框的熊猫列值

1回答