如何在pandas中创建分隔符read_csv更灵活wrt whitespace?
我需要使用存储在文件中的数据创建数据框。为此,我想使用read_csv
方法。但是,分隔符不是很规则。有些列由tabs(\t
)分隔,其他列由空格分隔。此外,一些列可以通过2或3个或更多个空格分隔,或者甚至通过空格和标签的组合(例如3个空格,两个标签然后1个空格)。
有没有办法告诉大熊猫正确对待这些文件?
顺便说一下,如果我使用Python,我就没有这个问题。我用:
for line in file(file_name): fld = line.split()
它完美无缺。它不关心字段之间是否有2或3个空格。即使空格和制表符的组合也不会造成任何问题。大熊猫可以这样做吗?
相关分类