如何比较两个 csv,从中寻找file_1.csv没有重复的行file_2.csv并将其打印到文件中?(熊猫打算使用):
import pandas as pd
original = pd.read_csv('file_1.csv', sep=';')
backup = pd.read_csv('file_2.csv', sep=';')
n = pd.concat([original,backup], axis=0)
n.drop_duplicates(keep='first', inplace=True)
n.to_csv('diff.csv', sep=';')
File_1.csv
A00;A01;B01
A10;A11;B12
A20;A21;B22
....
File_2.csv
A00;A01;B01
A20;A21;B22
diff.csv [Real]
A00;A01;B01
A20;A21;B22
diff.csv [Expected]
A10;A11;B12
这让我得到了两个文件之间重复的所有行,而不是 file_1 中 file_2 中缺少的行。
这些是大文件和大行数。谢谢
料青山看我应如是
相关分类