我有超过一百万个重叠的 2D 矩形(未旋转),我想将它们堆叠在一起并计数以形成热图/密度图/2D 直方图,显示哪些区域有更多的矩形,哪些区域有更少的矩形。理想情况下,我想在 Python 中执行此操作。从概念上讲,这是一个非常简单的问题,但我不确定如何有效地进行堆叠计算。
优化可能性
坐标存储在数据库中。因此,我可以简单地GROUP BY将坐标降低到 ~300,000^ 个矩形,每个矩形都有一个值,表示它代表多少个矩形。然后问题稍微改变为堆叠矩形并将它们的值求和(不计算)之一。(^我可能会得到这个数字低很多,但这超出了这个问题的范围)
数据
矩形,定义为简单的左下角右上角坐标对。
[[0, 0], [300, 400]]
[[10, 30], [50, 35]]
[[243, 12], [244, 13]]
...
选项
我考虑了几个选项,但似乎没有一个好,因为他们使用 GIS 工具来解决不必要的 GIS 问题:
匀称的图书馆- 它并不是真的为此而设计的,因为我只是在堆叠/计算东西。
通过gdalcalc的GDAL - 特别是对值求和,但这会引入大量额外的工作来首先创建/管理数十万个栅格(甚至是虚拟栅格)。
Numpy / Pandas或类似的东西?我以前从未使用过这些库,但是在谷歌上搜索这个问题时,它们出现了很多,尽管从来没有以一种看起来适用的方式出现。
将矩形转换为 1D 点的网格,然后简单地将它们输入2dhist
. 非常低效。
那么,将大量重叠矩形转换为密度图的有效方法是什么?
慕侠2389804
相关分类