我有多个 csv 文件,看起来像这样:
>>> print(df)
x x.1 x.2 x.3 ... Unnamed: 33 Unnamed: 34 Unnamed: 35 Unnamed: 36
0 x x x x ... x x x x
1 x x x x ... x x x x
2 x x x x ... NaN NaN NaN NaN
3 x x x x ... NaN NaN NaN NaN
4 x x x x ... NaN NaN NaN NaN
5 x x x x ... NaN NaN NaN NaN
6 x x x x ... NaN NaN NaN NaN
7 x x x x ... NaN NaN NaN NaN
8 x x x x ... NaN NaN NaN NaN
9 x x x x ... NaN NaN NaN NaN
10 x x x x ... NaN NaN NaN NaN
11 x x x x ... NaN NaN NaN NaN
12 x x x x ... NaN NaN NaN NaN
13 x x x x ... NaN NaN NaN NaN
[25 rows x 37 columns]
这个 csv 文件中有很多不同类型的数据,但我需要的唯一数据是标记为A-F. 我有大量的这些 csv 文件,所以我想要做的是将它们合并在一起,但只与我想要的数据合并。
我有两种方法,一种比另一种更好。
(1)我想要的数据几乎总是出现在行上,14-19并且有 4 列长。所以每次我在这些 csv 文件之一中阅读时我在想什么我可以跳过上面14和下面的行19但是我不确定如何做到这一点?
像这样的东西data = pd.read_csv(file,skiprows=[0:14])但是我也想跳过 19 之后的任何行?有没有办法,只是负载行14-19只列0-4?
(2)我的第二个想法我不确定是否可能但如果数据没有出现14-19在一个文件的行上,也许我可以让 python 以某种方式搜索我想要的数据,这将消除任何错误错误的行?
任何帮助表示赞赏,谢谢!
Qyouu
茅侃侃
相关分类