如何提取/剪切模型分类的图像部分？

您的想法是正确的，您可以根据类的数量拥有多个管道。训练：主要模型将是一个对象检测和定位模型，如 Faster RCNN、YOLO、SSD 等，经过训练，可以像猫和狗一样进行高级别的分类。此管道为您提供边界框详细信息（左、下、右、上）以及标签。子模型将是在情人级别上训练的多个模型。例如，经过训练对品种进行分类的模型。这可以通过使用 vgg、resnet、inception 等模型来完成。您可以在此处使用迁移学习。推理：通过主模型传递图像，使用边界框细节（左、下、右、上）裁剪检测对象，并根据标签信息，为其提供适当的子模型并提取结果。

如何提取/剪切模型分类的图像部分？

1回答