Pandas to_csv 处理 UnicodeEncodeError 的正确方法

我正在用 Pandas 处理一个文件 csv 文件，所以，我打开它：

df = pd.read_csv(my_file, low_memory=False)

我正在应用一些清理功能，将一些字符串更改为数字，然后当我想将数据帧保存到文件中时，我会这样做：

df.to_csv(output_file, index=False)

在某些情况下，这会抛出UnicodeEncodeError，所以我想知道如何避免这种情况。我知道encoding在read_csv和to_csv方法中有一个参数，但是每当我使用它时，它都会再次抛出错误。

我需要构建一个足够强大的代码，在文件具有非 ascii 字符的情况下不会失败。我知道有一个在一个参数str.encode的方法，这是ignore我想用类似的东西，但我不知道该怎么做。

编辑：

我知道我可以使用的编码方式latin1，iso-8859-1或者其他人，使其工作，但我想在输出文件中或者被编码ascii（最好）或utf-8。

慕莱坞森

浏览 518回答 1