我有一个类似于以下文件的数据集
2013-05-30 06:00:41 173.199.116.171
2013-05-30 06:05:41 61.245.172.14
2013-05-30 06:10:42 74.86.158.106
2013-05-30 06:20:42 61.245.172.14
我想对其进行20分钟的重新采样,并获取某个20分钟时隙的点击计数(例如,介于(06.00.00-06.20.00或06.40.00-07.00.00等之间)。我可以打印点击计数整个数据文件如下。
ips = df.groupby('IP').size()
如何获得每20分钟广告位的点击计数?下面的代码仅显示“ 06:00:00”和“ 06:20:00”之间的所有IP。
df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')
繁星淼淼
海绵宝宝撒
相关分类