您忘记了对图像进行标准化。当前,中的值在x_train范围内[0,255]。这会导致较大的梯度更新并拖延训练过程。在这种情况下,一种简单的标准化方案是:x_train = x_train.astype('float32') / 255x_test = x_test.astype('float32') / 255这将导致值落在范围内[0,1]。然后,您肯定会看到培训的进展。更复杂的归一化方案涉及按特征(即按像素)归一化或居中。在这种方法中,我们对所有图像进行归一化,以使所有图像中的每个像素的平均值为零,标准差为1(即,它们大多落在范围内[-1,1]):# make sure values are floatx_train = x_train.astype('float32')x_test = x_test.astype('float32')x_mean = x_train.mean(axis=0)x_train -= x_meanx_std = x_train.std(axis=0)x_train /= x_std + 1e-8 # add a small constant to prevent division by zero# normalize test data using the mean and std of training datax_test -= x_meanx_test /= x_std + 1e-8注意最后一部分:永远不要以自己的均值和std标准化测试数据。使用训练平均值和std代替。