pd.read_excel() 用 `nan` 字符串替换空格,pd.read_csv()

当我创建了一个DataFrame

pd.read_excel(my_excel_file, dtype=str)

电子表格中的空白单元格被替换为字符串nan。另一方面,DataFrame

pd.read_csv(my_csv_file, dtype=str)

numpy.nan对象替换空白。为什么是这样?


小唯快跑啊
浏览 591回答 2
2回答

长风秋雁

您可以为 指定一个na_values属性read_excel。df = pd.read_excel(my_excel_file, na_values=[''], dtype=object)

慕标5832272

我会试着回答你的问题,为什么是这样?使用dtype=str读取 Excel 文件时pd.read_excel,得到的结果与使用时得到的结果不一致pd.read_csv。主要原因或者您可以说,在使用numpy.nan时用对象替换空白单元格的优势pd.read_csv在于它便于您使用pd.isna,它仅适用于numpy.nan对象,否则仅适用于nan.有很多关于这个的讨论,可以说这个功能反过来允许在pd.read_csv和之间保持一致性pd.read_excel。您可以在 Pandas 的 Github 页面上阅读有关讨论的更多信息,在read_excel中对此进行了一些辩论,dtype=str 将空单元格转换为字符串 'nan' #20377
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python