对 Pandas 相当陌生,并开始掌握这个概念。希望你能给我指明正确的方向。
我是以下结构的测量温度值的数据集。该数据集大约有 1-2 百万个条目。由于某些传感器在某个时候出现故障,因此我存在相当多的缺失数据。
location temperature
timestamp
2019-08-22 21:28:56 Garage 23.54
2019-08-22 21:29:44 bedroom 23.33
2019-08-23 22:21:06 outside1 25.00
2019-08-23 22:21:33 outside2 24.12
2019-08-22 21:29:53 Garage 23.40
[...]
我想做的是以这样一种方式重新采样数据集,即各个传感器的时间戳排成一行。具体来说,我希望能够计算各种传感器的均值/差异。我怎样才能做到这一点?
总的来说,我不确定表示此类数据以使其易于使用的最佳方法是什么。我知道创建组,这已经是一个很好的开始。但我仍然不知道如何以简单的方式在传感器之间创建这些计算。
任何帮助将不胜感激。谢谢!
繁花如伊
湖上湖
随时随地看视频慕课网APP
相关分类