我有一个带有 TIME_IN 和 TIME_OUT 列的 DataFrame(日期时间到秒)。我想要一个新的 DF,其中包含按日期计算的持续时间总和(TIME_OUT - TIME_IN)。每天从早上 5 点到凌晨 5 点运行,所以我也对此进行了调整。
这是一个自学 Pandas 的迷你项目的一部分,但我的下一个应用程序将涉及更多,所以效率对我来说是关键。
我尝试了两种方法(resample 和 groupby),但都有相同的问题:timedelta DURATION 列没有求和。
df["DATE"] = pd.to_datetime((df["TIME_IN"]
- dt.timedelta(hours=hrEnd)).dt.date)
df["DURATION"] = df["TIME_OUT"] - df["TIME_IN"]
dfGroupBy= df.groupby("DATE").sum()
df.setindex("DATE", inplace=True)
dfResample = df.resample("D").sum()
看来 Pandas 并没有像我尝试的那样对 timedelta64 类型的列进行求和,因此返回的 DataFrame 根本不包括 DURATION 列。最有效的方法是什么?
元芳怎么了
守着一只汪
小唯快跑啊
随时随地看视频慕课网APP
相关分类