我有一个包含大约 800 万行文件名的大文件,我正在尝试搜索包含特定值的文件名。找到一个很好,但问题是我正在尝试搜索大约 50k 个唯一值,而且搜索所需的时间非常长。
with open('UniqueValueList.txt') as g:
uniqueValues = g.read().splitlines()
outF = open("Filenames_With_Unique_Values.txt", "w")
with open('Filenames_File.txt') as f:
fileLine = f.readlines()
for line in fileLine:
for value in uniqueValues:
if value in line:
outF.write(line)
outF.close()
我无法将 filenames 文件加载到内存中,因为它太大了。还有其他方法可以优化此搜索吗?
慕无忌1623718
慕哥6287543
相关分类