我有一个如下的数据框:
id_cliente id_ordine data_ordine id_medium
0 madinside IML-0042758 2016-08-23 1190408
1 lisbeth19 IML-0071225 2017-02-26 1205650
2 lisbeth19 IML-0072944 2017-03-15 1207056
3 lisbeth19 IML-0077676 2017-05-12 1211395
4 lisbeth19 IML-0077676 2017-05-12 1207056
5 madinside IML-0094979 2017-09-29 1222195
6 lisbeth19 IML-0099675 2017-11-15 1211446
7 lisbeth19 IML-0099690 2017-11-15 1225212
8 lisbeth19 IML-0101439 2017-12-02 1226511
9 lisbeth19 IML-0109883 2018-03-14 1226511
我想添加三列:
第一列可以命名为“每个客户的订单数”,应该是同一客户的订单进度。
所以顺序IML-0042758应该是 1,IML-0071225应该是 1,IML-0072944应该是 2,IML-0077676应该是 3,IML-0094979应该是 2,依此类推。
第二列可以命名为“同一客户的第一个订单和第 n 个订单之间的天数”,并显示同一客户下的不同订单之间的“data_ordine”差异(日期时间列)。
所以前 6 行的值是:0 (2016-08-23 - 2016-08-23), 0 (2017-02-26 - 2017-02-26), 17 (2017-03-15 - 2017) -02-26), 75 (2017-05-12 - 2017-02-26), 75 (2017-05-12 - 2017-02-26), 402 (2017-09-29 - 2017-02-26) .
第三列可以命名为“同一 id_medium 的第一个和第 n 个订单之间的天数”,并显示每个id_medium的不同订单之间的“data_ordine”差异(日期时间列)。 所以前 6 行的值是:0 (2016-08-23 - 2016-08-23), 0 (2017-02-26 - 2017-02-26), 0 (2017-03-15 - 2017) -03-15), 0 (2017-05-12 - 2017-05-12), 58 (2017-05-12 - 2017-03-15 因为媒体“1207056”是第二次订购), 0 ( 2017 年 9 月 29 日 - 2017 年 9 月 29 日)。
最后我想计算一个客户平均需要多长时间才能下第二个订单,第三个订单,第四个订单等等。
以及客户为相同的 id_medium 下第二、第三(等)订单平均需要多长时间。
万千封印
明月笑刀无情
随时随地看视频慕课网APP
相关分类