语境:
谷歌有一个 MNIST 数据的 spritesheet。他们拍了一张(28, 28, 1)图片,把它变成了(1, 784, 1)一行数据(784就是28*28)。然后他们对所有 65k 图像执行此操作。所以它适合像这样一个漂亮的 spritesheet:https ://storage.googleapis.com/learnjs-data/model-builder/mnist_images.png
我正在寻找制作我自己的数据精灵表。
我正在使用 numpy/PIL,所以当我将图像转换为 numpy 时,有 3 个通道。
问题: 如何将其展平,然后连接该平面图像,使其变成宽度 = 784、高度 = 图像数量的图像,全部为 RGB。
伪代码在这里:
# Load image image
image_data = image.load_img("/path/to.png", target_size=(28, 28))
# Create shape (28, 28, 3)
np_train = np.array(image_data)
# Goal change (28, 28, 3) into (1, 784, 3)
# then add that to some final_image, building to final_image (num_images, 784, 3)
# then
img = Image.fromarray(final_image)
img=.show # spritesheet of image data for consumption
编辑: 结果:https : //github.com/GantMan/rps_tfjs_demo/blob/master/spritemaker/makerps.py
qq_花开花谢_0
慕容3067478
相关分类