我正在尝试连接两个大型数字矩阵,第一个:features是np.arrayshape 1238,72,另一个是从.json文件中加载的,如下面的第二行所示,它是 shape 1238, 768。我需要加载、连接、重新索引、拆分为折叠并将每个折叠保存在自己的文件夹中。问题是我Killed迈出了第一步(将.json内容读入bert)
with open(bert_dir+"/output4layers.json", "r+") as f:
bert = [json.loads(l)['features'][0]['layers'][0]['values'] for l in f.readlines()]
bert_post_data = np.concatenate((features,bert), axis=1)
del bert
bert_post_data = [bert_post_data[i] for i in index_shuf]
bert_folds = np.array_split(bert_post_data, num_folds)
for i in range(num_folds):
print("saving bert fold ",str(i), bert_folds[i].shape)
fold_dir = data_dir+"/folds/"+str(i)
save_p(fold_dir+"/bert", bert_folds[i])
有没有办法可以有效地做到这一点?我的意思是,必须有更好的方法......熊猫,json lib?
感谢您的时间和关注
幕布斯7119047
尚方宝剑之说
相关分类