我有一个图像分类任务,其中我为每个图像创建了多个裁剪图以及翻转/翻转版本以扩展我的有限数据集。我已将数据集写入tfrecords文件,其中每个记录均由文件组成(这里简化为两个农作物,只有一个翻转的版本):
{
lbl: int,
crop_0: np.ndarray,
crop_1: np.ndarray,
crop_0_flipped: np.ndarray,
crop_1_flipped: np.ndarray
}
基本上每张输入4张图片。在训练过程中,我想将每个图像都分开对待,即将每个记录作为具有相同标签的4个图像馈入,并与数据集中的其余图像混排,以使N幅图像变为4N幅图像。在测试过程中(使用单独的但结构类似的数据集),我想拍摄每张图像,仅使用crop_0和crop_1图像,并对softmax输出进行平均以进行分类。
我的问题是-训练这种数据集的最佳,最有效的方法是什么?如果这会使培训效率降低,我愿意改变我的方法,而且似乎最简单的方法是将每个版本的tfrecords文件(裁切和翻转/翻页图像)分开并将文件交织到一个文件中数据集,但如果能提供帮助,我不想拥有一堆文件。
相关分类