加入 ADASYN 平衡特征和目标标签

我正在尝试使用 ADASYN 库来平衡我高度不平衡的数据。在我平衡我的数据之后,我必须将特征和目标标签 numpy 数组加入到一个数据框中。


这是我用于平衡数据的 Python 代码:


from imblearn.over_sampling import ADASYN

ada = ADASYN()

# X is feature set and y is the label

X_resampled, y_resampled = ada.fit_sample(X, y)

# Add X_resampled, y_resampled into one dataframe

我该怎么做?


桃花长相依
浏览 119回答 1
1回答

侃侃尔雅

X_resampled并且y_resampled是 numpy 数组,因此我们需要np.hstack(水平堆叠)它们在解决方案中。X_resampled是二维的,但是y_resampled是一维的。之前np.hstack,我们需要重塑y_resampled为一列的二维数组。全部一起:df = pd.DataFrame(np.hstack((X_resampled, y_resampled.reshape(-1, 1))))
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python