我有一个如下所示的 DataFrame:
import pandas as pd
import numpy as np
df = pd.DataFrame(data={'data': [4, np.nan]})
df
data
0 4.0
1 NaN
这个 DataFrame 是在解析来自各种来源的数据后生成的,有时我没有某些整数字段的值。
最终,这些数据将存储在 CSV 中,我想将其存储为整数 4 和空白。我也试过使用replace({numpy.nan: None})andreplace({numpy.nan: ''})但这没有帮助。
导出到 CSV 时,如何确保获得整数 4 和空白?最终目标是使用此 CSV 将其加载到已明确定义数据类型的 Redshift/Postgres 中。
更新: 我怎么写这个文件?
with s3fs.open(s3_path, 'wb') as f:
s = StringIO()
df.to_csv(s, index=False, header=True)
f.write(s.getvalue().encode('utf-8'))
s = None
相关分类