我有两个数据帧:1 个主要 df 和 1 个包含我想在主要数据帧(dfmatch)中删除的行。主要 df 比 dfmatch 具有更多列。
我只想删除主要 df 中的行,如果第 1 列、第 2 列和第 3 列等于 dfmatch 的相应列中的值。
列 extra1 和 extra2 也应该在 dfnew 中可用。
我当前的脚本仅显示列标题而不是其余行:
file = 'testdf.csv'
colnames=['column1', 'column2', 'column3', 'extra1', 'extra2']
df = pd.read_csv(file, names=colnames, header=None)
file = 'testdfmatch.csv'
colnames=['column1', 'column2', 'column3']
dfmatch = pd.read_csv(file, names=colnames, header=None)
dfnew = pd.concat([dfmatch,df,df], sort=False).drop_duplicates(['column1', 'column2', 'column3'], keep=False)
慕田峪9158850
手掌心
相关分类