我正在用 Pandas 处理一个文件 csv 文件,所以,我打开它:
df = pd.read_csv(my_file, low_memory=False)
我正在应用一些清理功能,将一些字符串更改为数字,然后当我想将数据帧保存到文件中时,我会这样做:
df.to_csv(output_file, index=False)
在某些情况下,这会抛出UnicodeEncodeError
,所以我想知道如何避免这种情况。我知道encoding
在read_csv
和to_csv
方法中有一个参数,但是每当我使用它时,它都会再次抛出错误。
我需要构建一个足够强大的代码,在文件具有非 ascii 字符的情况下不会失败。我知道有一个在一个参数str.encode
的方法,这是ignore
我想用类似的东西,但我不知道该怎么做。
编辑:
我知道我可以使用的编码方式latin1
,iso-8859-1
或者其他人,使其工作,但我想在输出文件中或者被编码ascii
(最好)或utf-8
。
相关分类