我有2个大文件(每个大约500k行或85mb),包含文件的校验和和文件路径本身。根据校验和获取文件之间差异的最佳方法是什么?我可以编写Java程序,脚本等,但目标是它必须高效。
例如,我有FileA:
ec7a063d3990cf7d8481952ffb45f1d8b490b1b5 /home/user/first.txt e0f886f2124804b87a81defdc38ad2b492458f34 /home/user/second.txt
文件 B:
650bc1eb1b24604819eb342f2ebc1bab464d9210 /home/user/third.txt ec7a063d3990cf7d8481952ffb45f1d8b490b1b5 /home/user/blah/dup.txt
我想输出两个文件,其中包含文件A和B中的唯一文件。
独一无二
e0f886f2124804b87a81defdc38ad2b492458f34 /home/user/second.txt
独特B
650bc1eb1b24604819eb342f2ebc1bab464d9210 /home/user/third.txt
在这种情况下,“first.txt”和“dup.txt”是相同的,因为它们的校验和是相同的,所以我将其排除为不唯一。最有效的方法是什么?文件不会以任何方式排序。
慕妹3242003
至尊宝的传说
qq_花开花谢_0
相关分类