我正在处理过去一年左右的睡眠数据集。我已经将CSV读入了熊猫数据框。其中有一个名为的列'Duration'。我将其转换为timeDelta,如下所示:
df.Duration = pd.to_timedelta(df.Duration)
df.Duration.head()
哪个输出
0 17711 days 08:27:00
1 17711 days 07:56:00
2 17711 days 04:22:00
3 17711 days 07:29:00
4 17711 days 06:46:00
Name: Duration, dtype: timedelta64[ns]
我有点理解为什么我会在工作时间前得到17711天,但我真正想要的只是工作时间。为了解决这个问题,我可以写
df.Duration = (df.Duration - pd.Timedelta('17711 days'))
这给了我
0 08:27:00
1 07:56:00
2 04:22:00
3 07:29:00
4 06:46:00
Name: Duration, dtype: timedelta64[ns]
但是,这是一种非常脆弱的方法。有一种更好的方法来获取我想要的时间吗?
MYYA
相关分类