通过阅读掩码 rcnn 气球示例(https://engineering.matterport.com/splash-of-color-instance-segmentation-with-mask-r-cnn-and-tensorflow-7c761e238b46),现在:
我的目标:
将带有方向和根位置注释信息的气球数据集提供给修改后的 mask_rcnn,然后它最终可以学习如何检测 val 数据集中每个气球的方向(以度为单位)和根位置。
状态:
对于训练数据集,我使用 VIA 绘制一条线(从根/处理程序到每个气球的最底部),可以指示图像中每个气球实例的方向,因为在 VIA 中,一条线包含 2 个点,因此第一个json 文件中的点将是每个气球实例的根坐标。下图显示了我的想法: 示例图片
我开发了一些可以:
从 json 文件中获取图像中所有气球实例的根坐标(浮点值)
通过所有气球的线的 2 个点计算方向(以度为单位的角度,带有 2 位数字的浮点值)
我想将获取的角度和根位置信息发送到掩码rcnn,在balloon.py中,我需要将它们添加到```
class BalloonDataset(utils.Dataset):
def load_balloon(self, dataset_dir, subset):
.......
self.add_image(
"balloon",
image_id=a['filename'], # use file name as a unique image id
path=image_path,
width=width, height=height,
polygons=polygons,
angles=angles,
roots=roots
)
``` 对吗?
我想我还需要在model.py中定义root和orientation的损失函数,但我认为我应该使用与掩码损失或盒子损失相同的类型,有人能给我一些提示吗?
有人可以给我一些想法我应该在model.py或其他地方更改什么?
相关分类