我正在开发一个流量跟踪系统,该系统分析已经收集的视频。我正在使用 opencv、threading、pytorch 和 dectron2。为了加快从 opencv 抓取帧的速度,我决定使用一个线程,它运行一个循环,用帧填充队列,如本文中所见。在实现这个之后,我可以像我的处理管道的其余部分一样快地访问帧,所以那里没有问题。当我现在对帧进行推理(只是通过 Faster R-CNN 模型的前向传递)时,就会出现问题,这需要 5 秒以上,而过去需要 0.11 秒。我的 GPU 正在被使用,而我的 CPU 远未充分利用。什么可能导致这种情况发生?
森栏
相关分类