我有一个超级脏的文本数据集。虽然各个列值是用制表符分隔的,但所需的数据行中有许多换行符。所有数据条目均由硬“\n”符号分隔。
我尝试将lineterminator
参数设置为'\n'
,但它仍然将换行符读取为新行。执行任何类型的正则表达式或相关操作很可能会导致制表符分隔丢失,我需要将数据加载到数据框中。由于数据集的大小,进行逐字或逐行操作也不完全可行。
有没有办法让 Pandas 不将换行符读取为新行,并且仅在看到'\n'时才转到新行?
突出显示的红色框应该是一个条目。
守着一只汪
相关分类