猿问

Pandas to_csv 处理 UnicodeEncodeError 的正确方法

我正在用 Pandas 处理一个文件 csv 文件,所以,我打开它:

df = pd.read_csv(my_file, low_memory=False)

我正在应用一些清理功能,将一些字符串更改为数字,然后当我想将数据帧保存到文件中时,我会这样做:

df.to_csv(output_file, index=False)

在某些情况下,这会抛出UnicodeEncodeError,所以我想知道如何避免这种情况。我知道encodingread_csvto_csv方法中有一个参数,但是每当我使用它时,它都会再次抛出错误。

我需要构建一个足够强大的代码,在文件具有非 ascii 字符的情况下不会失败。我知道有一个在一个参数str.encode的方法,这是ignore我想用类似的东西,但我不知道该怎么做。

编辑:

我知道我可以使用的编码方式latin1iso-8859-1或者其他人,使其工作,但我想在输出文件中或者被编码ascii(最好)或utf-8


慕莱坞森
浏览 315回答 1
1回答
随时随地看视频慕课网APP

相关分类

Python
我要回答