猿问

长数据帧的 Python Pandas 越界日期时间时间戳错误

我有一个df带有形状(500000,70)和几列的数据框,其中包括无效日期,例如4000-01-01 00:00:00. 在这个数据框的较小版本中,我试过


df["date"] = df["date"].astype(str)

df["date"] = df["date"].replace('4000-01-01 00:00:00', pd.NaT)

效果很好。还有版本


df["date"] = pd.to_datetime(df["date"].replace("4000-01-01 00:00:00",pd.NaT))

工作。对于长数据帧版本,我收到以下错误


OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 4000-01-01 00:00:00

任何建议如何以优雅的方式解决这个问题或问题可能是什么?


谢谢你。


米脂
浏览 1240回答 2
2回答

慕妹3242003

错误是因为:In [332]: pd.Timestamp.maxOut[332]: Timestamp('2262-04-11 23:47:16.854775807')日期的上限是这里。并且您的值超出范围,因此 OutOfBoundsError。
随时随地看视频慕课网APP

相关分类

Python
我要回答