随机化和填充数据集是什么意思?

我得到了一个不平衡的数据集,并要求我实现函数来 1/随机化数据 2/填充训练和验证数据。是否意味着随机打乱数据,然后将其拆分为训练集和验证集?


神不在的星期二
浏览 169回答 2
2回答

翻过高山走不出你

是的,我会说这就是问题对你的要求。由于数据集不平衡,请确保您分层(除非有理由不这样做,例如时间序列)。

人到中年有点甜

是的。这样做的主要目的是获得更多分层的训练和验证集。这是处理不平衡数据集的最简单方法。
打开App,查看更多内容
随时随地看视频慕课网APP

相关分类

Python