我在熊猫中有以下数据框
Date Time Tank Sales Quantity Delivery
2018-01-01 06:30 1 100 3444 0
2018-01-01 07:00 1 200 3144 0
2018-01-01 05:30 1 100 2900 0
2018-01-01 07:30 1 200 2800 0
2018-01-01 06:30 2 50 3000 0
2018-01-01 07:00 2 100 2950 0
2018-01-01 05:30 2 150 2800 0
2018-01-01 07:30 2 100 2704 0
2018-01-02 06:30 1 100 3444 0
2018-01-02 07:00 1 200 3144 0
2018-01-02 05:30 1 100 2900 50
2018-01-02 07:30 1 200 2800 0
2018-01-02 06:30 2 50 3000 0
2018-01-02 07:00 2 100 2950 0
2018-01-02 05:30 2 150 2800 50
2018-01-02 07:30 2 100 2704 0
我想在一天和坦克级别进行汇总,以获得当天的第一个和最后一个数量(按升序排列时间)以及销售和交付的总和。我想要的数据框是
Date Tank Open Close Sales Delivery
2018-01-01 1 2900 2800 600 0
2018-01-01 2 2800 2704 400 0
2018-01-02 1 2900 2800 600 50
2018-01-02 2 2800 2704 500 50
目前我正在熊猫中关注
这是为了按升序获取第一个和最后一个数量天和罐位排列时间。
data_open_close_inv = data.sort_values(['Date','Tank','Time']).groupby(['Date','Tank'])['Quantity'].agg(['first','last']).reset_index()
然后我将其汇总为销售和交付的总和
data_agg = data.groupby(['Date','Tank'], as_index = False).agg({'Sales':['sum'],'Delivery':['sum']}).reset_index()
然后再次结合两者。
我可以在熊猫中一步完成所有事情吗?
牛魔王的故事
相关分类