我有两种数据,一种是数据帧,一种是现在许多列表包含有关图像采集时间的数据,因此数据如下所示:
pandas 数据框(日期和时间为 23/6 -04/07,每天 07:00-17:00):
>>>timestamp date hour person_1 person_2 ............
0 2019-06-23 07:00:00 2019-06-23 07:00:00 0.124 0.431
1 2019-06-23 07:03:00 2019-06-23 07:03:00 0.131 0.438
2 2019-06-23 07:06:00 2019-06-23 07:06:00 0.154 0.433
3 2019-06-23 07:09:00 2019-06-23 07:09:00 0.164 0.441
....
2 2019-07-04 16:57:00 2019-07-04 16:57:00 0.864 0.675
3 2019-07-04 17:00:00 2019-07-04 17:00:00 0.823 0.631
每张图像拍摄的时间以列表的格式(“小时”一词后面的数字代表日期):
#Hours that the image was taken
Hours23=['07:00','08:00','09:32','10:14','11:15','12:17','13:03','14:41','15:04','17:05']
Hours24=['07:00','08:13','09:02','10:09','11:02','12:03','14:09','16:00','17:00']
Hours25=['08:15','09:02','10:02','11:02','12:02','14:02','15:02','16:00','17:00']
...
Hours3=['07:00','08:02','09:02','10:02','11:02','12:02','13:03','14:03','15:02','16:01','17:00']
Hours4=['07:15','08:02','12:02','13:03']
我想根据这些小时列表选择数据框中的行,例如,选择最接近图像的小时的行。例如,对于 23/6,图像的第一个小时是 07:00,然后是 08:00,然后是 09:32...
所以我想在我的数据框中仅包含该时间最接近的行到图像小时。
我看到有多种方法可以过滤它,正如这里提到的(在 Pandas 中查找最接近给定时间的 DataFrame 行),但我想考虑到每个日期都有不同的时间这一事实。
所以结果应该是这样的:
>>>timestamp date hour person_1 person_2 ............
0 2019-06-23 07:00:00 2019-06-23 07:00:00 0.124 0.431
1 2019-06-23 08:01:00 2019-06-23 07:00:00 0.108 0.370
1 2019-06-23 09:32:00 2019-06-23 07:00:00 0.101 0.360
...
蝴蝶不菲
相关分类