如何利用样本函数将数据分割成训练/测试集

如何利用样本函数将数据分割成训练/测试集

我刚刚开始使用R,我不知道如何将数据集与以下示例代码合并:

sample(x, size, replace = FALSE, prob = NULL)

我有一个数据集,我需要投入培训(75%)和测试(25%)集。我不知道我应该把什么信息放进x和尺码里?x是数据集文件吗?我有多少个样本?


临摹微笑
浏览 823回答 3
3回答

ITMISS

有许多实现数据分区的方法。要获得更完整的方法,请查看createDataPartition函数中的caret包裹。下面是一个简单的例子:data(mtcars)## 75% of the sample sizesmp_size <- floor(0.75 * nrow(mtcars))## set the seed to make your partition reproducibleset.seed(123)train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)train <- mtcars[train_ind, ]test <- mtcars[-train_ind, ]
打开App,查看更多内容
随时随地看视频慕课网APP