我正在尝试从pandas.read_csvJupyter Notebooks 中的 csv 文件中读取特定列。我知道我感兴趣的数据从哪一行开始,并使用skiprows关键字转到包含列标签的那一行。
但是,即使我指定了要使用usecols的列,Pandas 也只会删除列中的值,而不是列本身。因此,如果我test.csv看起来像这样:
*first 6 rows to be skipped*
1,2,3,4,5,6
a,b,c,d,e,f
A,B,C,D,E,F
片段(导入正确的模块后)
df = pandas.read_csv('test.csv', skiprows = 5, usecols = np.r_[0, 2:7])
给
1,2,3,4,5,6
a,nan,c,d,e,f
A,nan,C,D,E,F
而不是想要的
1,3,4,5,6
a,c,d,e,f
A,C,D,E,F
我已通读文档pandas.read_csv,但没有看到有关如何获得所需结果的指示。
ETA:我试图让 Pandas(或 Jupyter Noteooks)从数据框中排除列,而不仅仅是列包含的值。
精慕HU
Cats萌萌
撒科打诨
随时随地看视频慕课网APP
相关分类