R-CNN 中的说明

我正在学习使用 R-CNN 进行对象检测...

我有图像和注释文件,它给出了对象的边界框

我了解 R-CNN 中的这些步骤,

使用选择性搜索来获取建议的区域

使所有区域大小相同

在 CNN 中输入这些图像

保存特征图并馈送到 SVM 进行分类


在训练中,我将所有对象(仅来自图像的对象而不是背景)输入到 CNN,然后在 SVM 中训练特征图进行分类。

在每个博客中,都在说R-CNN,分为三个部分,1st -selective search 2nd -CNN 3rd -BBox Regression

但是,我没有得到 BBox 回归的深入解释。

我了解 IOU(Intercept over Union)来检查 BBox 的准确性。

您能否帮我了解如何使用此 BBox 回归来获取对象的坐标。


素胚勾勒不出你
浏览 114回答 1
1回答

噜噜哒

解释如下所述的 BBox 回归工作。就像你提到的那样,它发生在多个阶段。选择性搜索:生成初始子分割,我们生成许多候选或部分区域。使用贪心算法递归地将相似区域组合成更大的区域。使用生成的区域来生成最终的候选区域建议。CNN 和 BBox 回归:回归器是具有卷积层和全连接层的 CNN,但在最后一个全连接层中,它不应用通常用于分类的 sigmoid 或 softmax,因为这些值对应于概率。相反,这个 CNN 输出的是四个值 (𝑟,𝑐,ℎ,𝑤),其中 (𝑟,𝑐) 指定左角位置的值,(ℎ,𝑤) 指定窗口的高度和宽度。为了训练这个 NN,当 NN 的输出与训练集中标记的 (𝑟,𝑐,ℎ,𝑤) 非常不同时,损失函数将进行惩罚。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python