我有数千个 CSV 文件,每个文件包含数百列和数十万行。对于速度,我只想将数据导入我需要的 PANDAS 数据帧。我可以使用单独的元数据文件过滤我不需要的 CSV 文件,但我无法弄清楚如何删除我不需要的列(在导入期间——我知道如何过滤数据框的列在它被导入之后,但就像我说的,我试图避免导入不必要的数据)。
假设我有以下 csv 文件:
Date/Time Apple Tart Cherry Pie Blueberry Pie Banana Pudding Tomato Soup
1:00 2 4 7 6 5
2:00 3 5 4 5 8
3:00 1 4 7 4 4
我只想导入包含文本“饼图”以及“日期/时间”列的列。另请注意,我的所有 csv 文件的列名和列数都不同,因此“usecol”规范对我不起作用,因为我不知道要输入的具体列名。
杨__羊羊
HUWWW
相关分类