Python：如何在不使用更多 RAM 的情况下将 np 数组/列表拆分为两个数组/列表

X = []y = []for seq, target in ConvertedData:    X.append(seq)    y.append(target)X是一个列表seq。我假设这些是数组。X只是有指向那些的指针，y = np.vstack(y)train_x = np.array(X)[:int(len(X) * 0.9)]从制作一个数组X，然后是该数组的一个切片。完整的np.array(X)仍然存在于内存中train_y = y[:int(len(X) * 0.9)]validation_x = np.array(X)[int(len(X) * 0.9):]从制作另一个数组X。 train_x和validation_x是单独数组的视图。validation_y = y[int(len(X) * 0.9):]正在做X1 = np.array(X)train_x = X1[:...]validation_x = X1[...:]将消除这种重复。两者观点相同X1。另一种方法是先对列表进行切片：train_x = np.array(X[:...])validation_x = np.array(X[...:])我的猜测是内存使用，至少与在数组中会相似。del X创建之后X1可能也有帮助，允许X对其引用的数组进行垃圾收集。但请注意，一旦您在代码中的某一点开始遇到内存错误，像这样的技巧可能会推迟它。计算很容易最终制作出大小相当的副本或临时缓冲区。您的拆分使用 2 个切片；这会产生不会增加原始内存使用量的视图。但是，如果您进行混洗拆分，则训练和验证部分将是副本，并且一起占用与源一样多的内存。

Python：如何在不使用更多 RAM 的情况下将 np 数组/列表拆分为两个数组/列表

2回答