将过采样数据集保存为 pandas 中的 csv 文件

我是 Python 新手,如果太简单,请提前致歉。

我的代码是


# Split data

y = starbucks_smote.iloc[:, -1]

X = starbucks_smote.drop('label', axis = 1)


# Count labels by type

counter = Counter(y)

print(counter)

Counter({0: 9634, 1: 2895})


# Transform the dataset

oversample = SMOTE()

X, y = oversample.fit_resample(X, y)


# Print the oversampled dataset

counter = Counter(y)

print(counter)

Counter({0: 9634, 1: 9634})

如何保存过采样数据集以备将来使用?


我试过


data_res = np.concatenate((X, y), axis = 1)

data_res.to_csv('sample_smote.csv')

出错了


ValueError: all the input arrays must have same number of dimensions, 

but the array at index 0 has 2 dimension(s) and the array at index 1 has 1 dimension(s)

感谢任何提示!


潇潇雨雨
浏览 79回答 1
1回答

紫衣仙女

您可以创建数据框:data_res = pd.DataFrame(X) data_res['y'] = y然后保存data_res到 CSV。基于连接 od 的解决方案numpy.arrays也是可能的,但np.vstack需要使维度兼容:data_res = np.concatenate((X, np.vstack(y)), axis = 1) data_res = pd.DataFrame(data_res)
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python