这是我使用该函数的方式:
dataset = tf.keras.preprocessing.image_dataset_from_directory(
main_directory,
labels='inferred',
image_size=(299, 299),
validation_split=0.1,
subset='training',
seed=123
)
我想像本示例一样探索创建的数据集,特别是将其转换为数据帧的部分pandas。但我的最低目标是检查标签和附加的文件数量,只是为了检查它是否确实按预期创建了数据集(子目录是其中图像的相应标签)。
需要明确的是,它main_directory的设置如下:
main_directory
- class_a
- 000.jpg
- ...
- class_b
- 100.jpg
- ...
我希望看到数据集显示其信息,如下所示:
label number of images
class_a 100
class_b 100
此外,是否可以删除数据集中的标签和相应图像?我们的想法是,如果相应的图像数量小于一定数量或不同的指标,则丢弃它们。当然可以通过其他方式在此函数之外完成,但我想知道这是否确实可能,如果可以,如何实现。
达令说