我有一个导出为 TAB 分隔的文件,其中包含一些包含 TAB 字符的字符串字段,因此在导入时会将列移过来。我试图找到几种使用其他工具执行此操作的方法(例如,请参阅在制表符分隔文件 linux 中替换封闭字符串中的制表符,以获取使用 gawk 的解决方案)但希望能够从我的 Jupyter Notebook 执行此操作使用蟒蛇。
样本数据:
"badstring"1"good string"2"还不错""01/01/01"
需要成为
"坏串"1"好串""也不错""01/01/01"
我认为正则表达式是关键,但在这方面还不够熟练,无法快速将其整合在一起。现在我的想法是拆分选项卡,然后评估缺少结尾的字符串并开始引号,然后将它们重新连接在一起,但是这种方法可能存在一些陷阱,就像我现在所拥有的那样。
任何帮助,将不胜感激。谢谢....JP
偶然的你
相关分类