Keras 模型未能减少损失

您的代码有一个关键问题：维度洗牌。您永远不应该触及的一个维度是批处理维度- 因为根据定义，它包含数据的独立样本。在您的第一次重塑中，您将特征尺寸与批量尺寸混合：Tensor("input_1:0", shape=(12, 6, 16, 16, 16, 3), dtype=float32) Tensor("lambda/Reshape:0", shape=(72, 16, 16, 16, 3), dtype=float32)这就像喂食 72 个独立的形状样本(16,16,16,3)。其他层也有类似的问题。解决方案：与其重塑每一步（你应该使用它Reshape），不如塑造你现有的 Conv 和池化层，让一切都直接进行。除了输入和输出层，最好给每一层命名简短而简单 - 不会失去清晰度，因为每一行都由层名称明确定义GlobalAveragePooling旨在成为最后一层，因为它会折叠特征尺寸- 在您的情况下，如下所示(12,16,16,16,3) --> (12,3)：之后的转换几乎没有用根据上述，我替换Conv1D为Conv3D除非您使用可变批量大小，否则请始终使用batch_shape=vs. shape=，因为您可以全面检查图层尺寸（非常有帮助）您的真实值batch_size是 6，从您的评论回复中推断出来kernel_size=1并且（尤其是）filters=1是一个非常弱的卷积，我相应地替换了它 - 如果你愿意，你可以恢复如果您的预期应用程序中只有 2 个类，我建议您Dense(1, 'sigmoid')使用binary_crossentropy损失最后一点：除了维度改组建议之外，您可以将上述所有内容都扔掉，仍然可以获得完美的训练集性能；这是问题的根源。def create_model(batch_size, input_shape):    ipt = Input(batch_shape=(batch_size, *input_shape))    x   = Conv3D(filters=64, kernel_size=8, strides=(2, 2, 2),                             activation='relu', padding='same')(ipt)    x   = Conv3D(filters=8,  kernel_size=4, strides=(2, 2, 2),                             activation='relu', padding='same')(x)    x   = GlobalAveragePooling3D()(x)    out = Dense(units=2, activation='softmax')(x)    return Model(inputs=ipt, outputs=out)BATCH_SIZE = 6INPUT_SHAPE = (16, 16, 16, 3)BATCH_SHAPE = (BATCH_SIZE, *INPUT_SHAPE)def generate_fake_data():    for j in range(1, 240 + 1):        if j < 120:            yield np.ones(INPUT_SHAPE), np.array([0., 1.])        else:            yield np.zeros(INPUT_SHAPE), np.array([1., 0.])def make_tfdataset(for_training=True):    dataset = tf.data.Dataset.from_generator(generator=lambda: generate_fake_data(),                                 output_types=(tf.float32,                                               tf.float32),                                 output_shapes=(tf.TensorShape(INPUT_SHAPE),                                                tf.TensorShape([2])))    dataset = dataset.repeat()    if for_training:        dataset = dataset.shuffle(buffer_size=1000)    dataset = dataset.batch(BATCH_SIZE)    dataset = dataset.prefetch(tf.data.experimental.AUTOTUNE)    return dataset结果：Epoch 28/50040/40 [==============================] - 0s 3ms/step - loss: 0.0808 - acc: 1.0000

Keras 模型未能减少损失

2回答